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Thermostabiler in vitro Komplex mit Polymeraseaktivitat 



Beschreibung 

5 

Die Erfindung betrifft einen thermostabilen in wfro-Komplex zur Template- 
abhangigen Elongation von Nukleinsauren, einen thermostabilen in vitro 
Komplex sowie dafur kodierende DNA-Sequenzen und Vektoren. Die Erfindung 
betrifft weiterhin die Verwendung der erfindungsgemalien Komplexe in 
10 Verfahren zur Template-abhangigen Elongation von Nukleinsauren, wie PCR 
Reaktionen reversen Transkription, DNA-Markierung oder DNA- 
Sequenzierung, bei denen in vitro Template-abhangige DNA Strangsynthese 
erfolgt. SchlieBlich betrifft die Erfindung noch Kits bzw. Reagenzienkits zur 
DurchfQhrung der erfindungsgemalien Verfahren. 

15 

DNA-Polymerasen gehflren zu einer Gruppe von Enzymen, die einzelstrangige 
DNA als Template fur die Synthese eines komplementaren DNA Stranges 
verwenden. Diese Enzyme spielen eine bedeutende Rolle im 
Nukleinsaurestoffwechsel. einschlielilich der Prozesse DNA-Replikation. 

20 Reparatur und Rekombination. DNA-Polymerasen wuraen in alien zellularen 
Organismen identifiziert, von bakteriellen bis zu menschlichen Zellen, in vielen 
Viren sowie in Bakteriophagen (Komberg, A. & Baker, T. A. (1991) DNA 
Replikation WH Freeman. New York. NY). Man falit in der Regel die 
Archaebakterien und die Eubakterien zusammen zu der Gruppe der 

25 Prokaryonten. der Organismen ohne echten Zellkem, und stellt ihnen die 
Eukaryonten. die Organismen mit echtem Zellkem. gegenuber. Gemeinsam 
sind vielen Polymerasen aus den verschiedensten Organismen oftmals 
Ahnlichkeiten in der Aminosauresequenz sowie Ahnlichkeiten in der Struktur 
(Wang. J., Sattar. A.K.MA; Wang. C.C.. Karam. J.D.. Konigsberg. W.H. & 

30 Steitz. T.A. (1997) Crystal Structure of pol a familily replication DNA 



WO 00/08164 



-2- 



PCT/DE99/02480 

"* 



polymerase from bacteriophage RB69.Cell 89, 1087-1099). Organismen wie 
der Mensch besitzen eine Vielzahl von DNA-abhangigen Polymerasen von 
denen jedoch nioht alle fur die DNA-Replikation zustandig sind. sondern einige 
auch DNA-Reparatur durchfuhren. Replikative DNA-Polymerasen bestehen in 
5 vivo meist aus Proteinkomplexen mrt mehreren Einheten, welche die 
Chromosomen der zellularen Organismen und Wen replizieren. Eine generelle 
Eigenschaft dieser replizierenden Polymerasen ist im allgemeinen eine hohe 
Prozessivitat, das heiBt, deren Fahigkeit, Tausende von Nukleotiden zu 
polymerisieren ohne vom DNA Template abzudissoziieren (Komberg, A & 
10 Baker, T. A. (1991) DNA Replication. WH Freeman, New York, NY). 

Im Stand der Technik sind hochprozessive Replikationsmechanismen 
bekannt. wobei es sich dabei zum einen urn zellulare Mechanismen und zum 
anderen urn die bei den Bakteriophagen T4 und T7 auftretetenden 
15 Repliaktionsmechanismen handelt. 

Der Repiiaktionsapparat umfafJt eine Vielzahl von Komponenten. Dazu 
geh6ren, unter anderem. a) Polymeraseaktivitat aufweisende Proteine, b) 
Proteine, die an der Ausbildung einer Klammerstruktur beteiligt sind wobei 

20 der Klammerstruktur unter anderem die Aufgabe zukommt, eine 
Polymeraseaktivitat an ihr Template zu binden, die Bindung zu stabilisieren 
und somit die Dissoziationskonstante entsprechend zu andern, c) Proteine 
welche die Klammer auf das template laden, d) Proteine, welche das 
Template stabilisieren und gegebenenfalls e) Proteine. welche die 

25 Polymerase an das Template fohren . 

Die unter b) genannten Proteine bilden Strukturen aus, die entweder offen 
Oder geschlossen sind, beispielsweise ringformige oder halbringf6rmige 
Strukturen. Derfei Strukturen kennen durch eine oder mehrere Spezies von 
30 Proteinen ausgebildet werden. Dabei ist es moglich, dalj eine der besagten 
Proteinspezies eine Polymeraseaktivitat aufweist. 
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Die fur die Ausbildung dieser Strukturen verantwortlichen Proteine werden, 
sofern sie keine Polymeraseaktivitat aufweisen, hierin im folgenden als 
„Gleitklammerproteine" Oder „Klammerproteine° bezeichnet. 

5 

Beispielhaft sei for einen prozessiven Replikationsapparat, der nicht 
geschlossen ringformig ist, auf denjenigen des Bakteriophagen T4 oder 17 
hingewiesen. 

10 Beispielhaft sei fur einen prozessiven Replikationsapparat, der geschlossen 
ringformig ist, auf denjenigen des Bakteriums £ coli hingewiesen (Stukenberg, 
P.T., Studwell-Vaughan, P.S.& O'Donell, M. (1991) Mechanism of the p-clamp 
of DNA polymerase III holoenzyme. J. Biol. Chem. 266, 11328-11334; Kuriyan, 
J. & O'Donnel, M. (1993) Sliding clamps of DNA polymerases. J.Mol.Biol.234, 

15 915-925). 

Es ist bekannt, dad der Replikationsapparat in Archaebakterien dem 
eukaryontischen Replikationsapparat ahnlich ist, obwohl die 
Genomorganisation in Eukaryonten und Archaebakterien ganzlich verechieden 
20 ist und die zellulare Struktur der Eubakterien dem der Archaea ahnelt. (Edgell, 
D.R. and Doolittle, W.F. (1997). Archaea and the origin(s) of DNA replication 
proteins. Cell 89, 995-998.). 

Die Gleitklammer ist haufig uber ein oder mehrere weitere Proteine an ein 
25 Elongationsprotein gebunden, mit anderen Worten an das Elongationsprotein 
gekoppelt. Ein derartiges koppelndes Protein wird hierin im folgenden als 
Kopplungsprotein oder koppelnde Untereinheit bezeichnet, wobei gegebenfalls 
die Kopplung Qber eine Mehrzahl von Kopplungsproteinen erfolgen kann. 



Unter Elongationsprotein soli hierin im ubrigen ein PolymeraseaktMtat- 
aufweisendes Protein oder Komplex verstanden werden, das oder der 
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mindestens eine Oder mehrere der folgenden Eigenschaften aufweiBt: 
Verwendung von RNA als Template zur Synthese von DNA und/oder RNA, 
Verwendung von DNA als Template zur Synthese von DNA und/oder RNA 
Synthese von RNA. Synthese von DNA, Synthese von Nukleinsauren aus DNA 
5 und RNA, Exonukleaseaktivitat in 5-3'- Richtung und Exonukleaseaktivitat in 
3-5'-Richtung, Strangverdrangungsaktivitat (strand-displacement activity) 
Thermostability und Prozessivitat Oder Nicht-ProzessivitaL 

Die dreidimensionale Struktur von verschiedenen Gleitklammerproteinen wurde 
10 bereits bestimmt 

- die des eukaryontischen proliferating cell nuclear antigen (PCNA) (Krishna, 
T.S.R., Kong, X.-P., Gary, S., Burgers, P. M. & Kuriyan, J. (1994) Crystal 
structure of the eukaryotic DNA polymerase processivity factor PCNA. Cell 
79, 1233-1243; Gulbis, J. M., Kelman, Z., Hurwitz, J., O'Donnel, M. & Kuriyan, 

15 J. (1996) Structure of the C-terminal region of p21WAF1/CIP1 complexed 
with human PCNA. Cell 87, 297-306), 

- die der B-Untereinheit der Polymerase III des Eubakteriums Escherichia coli 
(Kong, X.-P., Onrust, R., O'Donnell, M. & Kuriyan; J. (1992) Three 
dimensional structure of the p-subunit of Escherichia coli DNA polymerase III 

20 holoenzyme; a sliding DNA clamp. Cell 69, 425-437) 

- und die des Gen45-Proteins des Bakteriophagens T4 Proteins (Kelman, Zvi, 
Hurwitz, J. O'Donnel, Mike (1998) Structure, 6, 121-125). 

Die Gesamtstruktur dieser Gleitklammem ist sehr ahnlich; die Bilder der 
25 ringformig ausgebildeten Proteingesamtstruktur von PCNA, der p-Untereinheit 
und gp45-Ringe sind ubereinandergelegt deckungsgleich (Kelman, Z & 
O'Donnell. M. (1995) Structural and functional similarities of prokaryotic and 
eukaryotic sliding clamps. Nucleic Acids Res. 23. 3613-3620). Jeder Ring hat 
vergleichbare Dimensionen und eine zentrale Offnung, die graft genug ist, urn 
30 Duplex-DNA, also einen DNA-Doppelstrang, bestehend aus den zwei 
komplementaren DNA-Strangen, zu umschlielien. 
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Die Gleitklammer kann sich in vivo nicht selbst urn die DNA herum 
positionieren, sondem muB urn die DNA fixiert werden. In Prokaryonten und 
Eukaryonten besteht ein derartiger Proteinkomplex aus einer Vielzahl von 
5 Untereinheiten, der beim Eubakterium Escherichia coli y-Komplex und beim 
Menschen Replikationsfaktor C (RF-C) genannt wird (Kelman, Z. & ODonnell, 
M. (1994) DNA replication - enzymology and mechanisms. Curr. Opin. Gent 
Dev. 4. 185-195). Der Proteinkomplex erkennt das 3'-Ende des Primers des 
„Primer-Template-Duplexes" und positioniert die Gleitklammer in Anwesenhert 
10 von ATP urn die DNA. 



Im Falle des Bacteriophagen T7 wird das gleiche Ziel, eine prozessive DNA- 
Synthese, mittels eines strukturell anderen Proteinkomplexes erreicht. Der 
Phage exprimiert eine eigene katalytische Polymerase, die T7-Polymerase, die 

15 das Genprodukt des gene 5, welche mil einem Protein aus dem Wirt 
Escherichia coli, dem Thioredoxin, eine Bindung eingeht und als Replikase 
eine hochprozessh/e DNA-Replikation ermoglicht (Proc. Natl. Acad. Sci. U S A 
1992 Oct 15; 89(20):9774-9778 Genetic analysis of the interaction between 
bacteriophage T7 DNA polymerase and Escherichia coli thioredoxin, Himawan 

20 JS, Richardson CC). Auch hierbei kommt es zur Klammerbildung, jedoch weist 
diese Klammer nicht die gleiche Struktur auf, wie z.B. im Falle des 
eukaryontischen PCNA. 



Oft ist es notig, wie zum Beispiel im Falle der humanen Polymerase 8, daB 
Kopplungsproteine eine Verbindung zwischen dem katalytisch aktiven Teil der 
Polymerase und dem Prozessivitatsfaktor (Gleitklammer) zu schaffen. Beim 
Menschen ist dies die kleine Untereinheit der 5-Polymerase (Zhang, S.-J., 
Zeng, X.-R., Zhang, P., Toomey, N.L, Chuang, R.Y.. Chang, L-S., and Lee, 
M.Y.W.T. (1994). A conserved region in the amino terminus of DNA 
polymerase 8 is involved in proliferating cell nuclear antigen binding. J. Biol. 
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Chem. 270, 7988-7992). Im Faiie der T7 Polymerase jedqch bindet der 
Prozessivitatsfaktor die katalytische Einheit der Polymerase direkt 

DNA-Polymerasen werden unter anderem durch zwei Eigenschaften 
5 charakterisiert, ihre Elongationsrate, das heiflt die Anzahl der Nukleotide, die 
sie pro Sekunde in einen wachsenden DNA-Strang inkorporieren konnen, und 
ihre Dissoziationskonstante. Wenn die Polymerase nach jedem 
Inkorporationsschritt eines der Nukleotide in die wachsende Kette wieder vom 
Strang abdissoziiert (d.h. ein Elongationsschritt erfolgt pro Bindungsereignis), 

10 dann hat die Prozessivitat den Wert 1 und die Polymerase ist nicht prozessiv. 
Diese Synthese wird distributiv genannt. Wenn die Polymerase fur wiederholte 
Nukleinsaureinkorporationen mit dem Strang verbunden bleibt, dann wird der 
Replikationsmodus als prozessiv bezeichnet und kann einen Wert von 
mehreren Tausend erreichen (siehe hierzu auch: Methods in Enzymology 

15 Volume 262, DNA Replication, Edited by J. L. Campbell, Academic press 1995, 
pp. 270-280) 

Fur die meisten in vitro Anwendungen, wie PCR oder 
Sequenzierungsprozesse, ist Prozessivitat eine wunschenswerte Eigenschaft, 

20 die allerdings die bislang in diesen Reaktionen eingesetzten thermostabilen 
Enzyme nur in geringem Malie besitzen, wohingegen die 
temperaturempfindlichen, mit Thioredoxin assoziierte T7 Polymerase eine 
Prozessivitat von einigen tausend Nukleotiden autweist. Im Vergleich - die 
thermostabile DNA-Polymerase aus Thermus thermophilus oder Thermus 

25 aquaticus haben nur eine Prozessivitat von etwa 50 Nukleotiden (Biochim 
Biophys Acta 1995 Nov 7;1264(2):243-248 Inactivation of the 5'-3* exonuclease 
of Thermus aquaticus DNA polymerase. Merkens LS, Bryan SK, Moses RE). 

Die U.S. Patente 4,683,195, 4,800,195 und 4,683,202 beschreiben die 
30 Anwendung solcher thermostabiler DNA-Polymerasen in der Polymerase- 
Kettenreaktion (PCR). In der PCR wird unter Verwendung von Primem, 
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Template (audi Matrize genannt), Nukleotiden, einer DNA-Polymerase eines 
entsprechenden Puffers und geeigneten Reaktionsbedingungen DNA neu 
synthetisiert. Hierbei wird Qblicherweise von einer doppelstrangigen DNA- 
Sequenz ausgegangen, von der ein bestimmter Zielbereich amplifiziert werden 
5 soli. Hierbei werden zwei Primer eingesetzt, welche zu flankierenden Bereichen 
der Zielsequenz auf jeweils einem Teilstrang des DNA-Doppelstranges 
komplementar sind. Zur Anhybridisierung der Primer werden allerdings die 
DNA-Doppelstrange zuerst denaturiert, insbesondere thermisch 
aufgeschmolzen. Nach Anhybridisierung der Primer erfolgt eine Elongation 
10 mittels der Polymerase. Daraufhin wird nochmals denaturiert und damit die neu 
gebildeten DNA-Strange von den Template-Strangen getrennt. woraufhin fur 
einen weiteren Elongationszyklus neben den urspriinglichen Template- 
Strangen auch die im ersten Schritt gebildeten Nukleinsaure-Strange als 
Template zur Verfugung stehen, diese jeweils emeut mil Primem hybridisiert 
15 werden und eine emeute Elongation stattfmdet. Diese Vorgehensweise wird 
zyklisch durchgefuhrt unter jeweils thermischer Denaturierung als 
Zwischenschritte. Bei der PCR kommt es bevorzugt zur Verwendung einer 
thermostabilen Polymerase, welche das zyklische, thermische Aufschmelzen 
der DNA Strange iibersteht. So wird haufig Taq DNA-Polymerase verwendet 
20 (U.S. Patent 4,965,188). Die Prozessivitat der Taq DNA-Polymerase ist jedoch, 
wie oben ausgefiihrt, relativ gering im Vergleich zur T7-Polymerase. 

DNA-Polymerasen finden auch bei der DNA-Sequenzbestimmung Anwendung 
(Sanger et al., Proc. Natl. Acad. Sci., USA 74:5463-5467 (1997)). Haufig wird 

25 bei der Sequenzierung nach Sanger eine T7-DNA-Polymerase verwendet 
(Tabor, S. und Richardson, C.C. Proc. Natl. Acad. Sci., USA 86:4076-4080 
(1989)). Spater wurde das Cycle-Sequencing-Verfahren entwickelt (Murray, V. 
(1989) Nucleic Acids Res. 17, 8889), welches kein einzelstrangiges Template 
erfordert und die Initiierung der Sequenzreaktion mit verhaltnismaBig geringen 

30 Mengen an Template erlaubt. Die hierbei zur Verwendung kommenden 
Polymerasen kannen z.B. die oben erwahnte Taq-Polymerase sein (U.S. 
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Patent 5,075, 216) Oder die Polymerase von Thermotoga neapolitana (WO 
96/10640) Oder andere thermostabile Polymerasen. Neuere Verfahren koppeln 
die exponentielle Amplifikation und die Sequenzierung eines DNA-Fragmentes 
in einem Schritt, so daB es mdglich ist, genomische DNA direkt zu 
5 sequenzieren. Eines der Verfahren, das sogenannte DEXAS-Verfahren 
(Nudeic Acids Res 1997 May 15;25(10):2032-2034 Direct DNA sequence 
determination from total genomic DNA. Kilger C, PSabo S. Biol. Chem. 1997 
Feb; 378(2):99-105 Direct exponential amplification and sequencing (DEXAS) 
of genomic DNA. Kilger C, PaSbo S und DE 19653439.9 sowie DE 
10 19653494.1), verwendet eine Polymerasen mit verminderter 
Diskriminierungsfahigkeit gegenuber Dideoxynukleotiden (ddNTPs) im 
Vergleich zu Deoxynukleotiden (dNTPs) sowie einen Reaktionspuffer, zwei 
Primer, die bevorzugt nicht aquimolar vorliegen, und die oben genannten 
Nukleotide, urn dann in mehreren Zyklen eine komplette, sequenzspezifische 
15 DNA-Leiter eines Fragmentes zu erhalten, welches von den Primern flankiert 
ist. Eine Weiterentwicklung dieses Verfahrens besteht in der Verwendung eines 
Polymerasegemisches, wobei eine der beiden Polymerasen zwischen ddNTPs 
und dNTPs diskriminiert, wahrend die zweite eine verminderte 
Diskriminierungsfahigkeit aufweist (Nucleic Acids Res. 1997 May 15- 
20 25(10):2032-2034 Direct DNA sequence determination from total genomic 
DNA. Kilger C, PaSboS). 

DNA-Polymerasen finden auch Anwendung bei der reversen Transkription von 
RNA in DNA. Hierbei dient RNA als Template und die Polymerase synthetisiert 
25 einen komplementaren DNA-Strang. Zur Anwendung kommt hier z.B. die 
thermostabile DNA-Polymerase aus dem Organismus Thermus thermusphilus 
(Tth) (U.S. Patent 5,322,770). 

Es kann auch vorkommen, daB die Polymerase eine 'proof-reading' Aktivftat 
30 besitzt, also eine 3"-5' Exonukleaseaktivitat aufweist. Diese Eigenschaft ist 
insbesondere dann wiinschenswert, wenn das zu synthetisierende Produkt mit 
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einer niedrigen Fehlenate bei der Nukleotidinkorporation hergestellt werden 
soli. Ein Beispiel stellen Polymerasen aus dem Organismus Pyrococcus wosei 
dar. 



5 Die oben genannten Enzyme, die ublicherweise in PCR-Reaktionen eingesetzt 
werden, gehdren in vivo grofitenteils nicht zu den eigentlichen 
Replikationsenzymen. sondern es sind zumeist Enzyme, von denen man 
annimmt, dalJ sie bei der DNA-Reparatur beteiligt sind, weshalb dersn 
Prozessivitat relativ gering ist. 

10 

Somit war es eine Aufgabe der vorliegenden Erfindung, mehrere der 
vorgenannten Eigenschaften von Polymerasen, insbesondere hohe 
Prozessivitat und Thermostabilitat. fur die Verwendung in in vitro Reaktionen zu 
vereinen. 

15 

Diese Aufgabe wurde erfindungsgemafi gelost durch die Bereitstellung eines 
thermostabilen in wto-Komplexes. umfassend ein thermostabiles 
Gleitklammerprotein und ein thermostabiles Polymeraseaktivitat-aufweisendes 
Elongationsprotein. Der erfindungsgemalie Komplex kann dabei zurTemplate- 
20 abhangigen Elongation von Nukleinsaure(n) dienen. 

Dieser Komplex kann in in wf/o-Reaktionen. wie z.B. in PCR-Reaktionen, 
eingesetzt werden und weist dabei eine hohe Prozessivitat auf. Von Vorteil ist 
zudem, dafi der Komplex eine geringe Fehlerquote bei der 

25 Nukleotidinkorporation aufweist, also eine erhohte Genauigkeit beim 
Baseneinbau hat. Dieser Komplex kann somit bei der Elongation, der 
Amplifikation, der Reversen Transkription. DNA-Markierung und der 
Sequenzierung von Nukleinsauren in vorteilhafter Weise eingesetzt werden. 
Die vorstehend aufgezeigten Verwendungsmoglichkeiten stellen jeweils fur sich 

30 besonders bevorzugte AusfOhrungsformen der Erfindung dar. 
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lm Falle der Verwendung des erfindungsgemafJen Komplexes zur Amplifikation 
von Nukleinsaurensauren wurde Qberraschend festgestellt, dafJ das dabei 
hergestellte Amplifikationsprodukt eine besonders niedrige 
Basenfehlinkorporationsrate aufweist. 

Bei der Verwendung eines solchen Komplexes, beispielsweise in Standard- 
PCR-Reaktionen, wird eine einfache Handhabung und eine hohe Prozessfvitat 
gewahrleistet, wie dies beispielsweise aus Fig. 26 ersichtlich ist. 

In einer Ausfuhrungsform ist vorgesehen, daft bei dem erfindungsgemafJen in 
wf/o-Komplex das Gleitkammerprotein mit dem Elongationsprotein verbunden 
ist. 



In einer bevorzugten Ausfuhrungsform deserfindungsgemaften thermostabilen 
15 in i/ffro-Komplexes sind das Gleitklammerprotein und das Elongationsprotein 
uberein Kopplungsprotein verbunden. 

Die Kopplung zwischen Gleitklammerprotein und Polymeraseaktivitat 
aufweisendem Elongationsprotein kann durch kovalente, aber auch durch 
20 nicht-kovalente Bindung erfolgen. In einer bevorzugten atternativen 
Ausfuhrungsform ist vorgesehen, dafJ eine direkte Kopplung zwischen 
Gleitklammerprotein und Elongationsprotein erfolgt 

Dabei kann vorgesehen sein, dafi das Gleitklammerprotein und/oder das 
25 Elongationsprotein aus Archaebakterien stammen. 

In einer bevorzugten Ausfuhrungsform des erfindungsgemafJen Komplexes 
handelt es sich urn einen prokaryontischen in wfro-Komplex. 
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In einer bevorzugten AusfOhrungsform kann es sich bei dem 
erfindungsgemafJen prokaryontischen Komplex urn einen archaebakteriellen in 
wfro-Komplex handeln. 

5 In einer bevorzugten altemativen Ausfuhrungsform kann es sich bei dem 
erindungsgemafien prokaryontischen Komplex urn einen eubakteriellen in vitro- 
Komplex handeln. 

In einer altemativen Ausfuhrungsform des erfindungsgemafJen Komplexes 
10 handeft es sich urn einen eukaryontischen in wt/o-Komplex. 

In diesem Zusammenhang ist ein prokaryontischer in wto-Komplex ein 
solcher, bei dem das Gleitklammerprotein prokaryontischen Ursprungs ist 
unabhangig vom Ursprung des Elongationsproteins. Entsprechend ist ein 

15 eubakterieller Komplex ein solcher, bei dem das Gleitklammerprotein 
eubakteriellen Ursprungs ist, unabhangig vom Ursprung des 
Elongationsproteins. Entsprechend ist ein archaebakterieller Komplex ein 
solcher, bei dem das Gleitklammerprotein archaebakteriellen Ursprungs ist, 
unabhangig vom Ursprung des Elongationsproteins. Entsprechend ist weiterhin 

20 ein eukaryontischer Komplex ein solcher, bei dem das Gleitklammerprotein 
eukaryontischen Ursprungs ist, unabhangig vom Ursprung des 
Elongationsproteins. 



Gegenstand der vorliegenden Erfindung sind ebenfalls solche thermostabilen in 
vtfro-Komplexe, bei denen die die Komplexe aufbauenden Proteine zum Teil 
aus Archaebakterien, Eukaryonten und aus Eubakterien stammen. Insowert 
sind jegliche Permutationen der in wf/o-Komplexe hinsichtlich der 
Proteinkomponenten und ihres jeweiligen Ursprunges Gegenstand der 
vorliegenden Erffindung. 
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Uispmng im vorstehenden Sinne soli dabei jene Quelle bezeichnen, auf die 
das Gen, die Geninformation Oder das Protein zuruckzufOhren ist 

Davon unabhangig ist die tatsachliche Art und Weise der Gewinnung des 
5 Gleitklammerproteins bzw. des Elongationsproteins, die beispielsweise durch 
chemische Synthese, gentechnologische Verfahren Oder Isolierung aus den 
natiirlichen Quellen erfolgen kann. 

Insbesondere ist Gegenstand der Erfindung ein thermostabiler 
10 prokaryontischer in wf/o-Komplex zur Elongation, insbesondere zur Template- 
abangigen Elongation von Nukleinsauren, der ein thermostabiles 
Gleitklammerprotein (Fig. 20), welches die komplementaren 
Nukleinsaurestrange ganz oder teilweise umschlieRt, und ein thermostabiles, 
Polymeraseaktivitat (Fig. 21 und Fig. 22) aufweisendes Protein umfa&t, wobei 
15 dieses Protein oder dieser Proteinkomplex mit dem Gleitklammerprotein 
gekoppelt oder assoziiert ist. 

Im Rahmen der vorliegehden Erfindung umfallt der Begriff Polymeraseaktivitat- 
aufweisendes Elongationsprotein auch Polymeraseaktivitat-aufweisende 
20 Proteinkomplexe oder Untereinheiten solcher Komplexe, welche die 
Polymeraseaktivitat tragen. 

Thermostabil im Sinne der voriiegenden Erfindung bedeutet, dafi der in vitro- 
Komplex mit hoher ProzessivitSt Nukleotide in wachsende Nukleinsaurestrange 
25 inkorporiert, sowohl bei niedrigen als auch bei hohen Temperaturen, die in der 
PCR oder einer anderen Reaktion auftreten, wie z.B. der DNA-Sequenzierung. 

Die PCR besteht z.B. in der Regel aus den Schritten der Denaturierung (70°C 
bis 98°C), dem Annealing (40°C bis 78°C) und der DNA-Strangsynthese (60°C 
30 bis 76°C). Somit muB dieser Komplex mindestens zwischen ca. 60°C und ca. 
70°C, bevorzugt insbesondere zwischen 60°C und 76°C und besonders 
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bevorzugterweise funktionsfahig sein zwischen 40°C und 98°C. Es dOrfen 
wahrend der gesamten Reaktion keine irreversiblen 
Denaturierungserscheinungen des Komplexes oder einzelner Komponenten 
auftreten, welche die Elongationsreaktion unterbinden oder inhibieren. 

5 

Die Gleitklammer 

Die folgenden Ausfuhrungen sollen dazu dienen, die Funktion und die 
mSglichen Erscheinungsfbrmen der Glertkammer bzw. des 
Gleitklammerproteins zu veranschaulichen. 

10 

Das Gleitklammerprotein erfOllt die Funktion. das Elongationsprotein an die 
DNA zu binden. Wie eingangs bereits ausgefuhrt, umschliefit das 
Gleitklammerprotein selbst die einzelstrangige oder doppelstrangige 
Nukleinsaure ganz oder teilweise oder durch Assoziation an das 
15 Polymeraseaktivrtat aufweisende Protein beziehungsweise an den 
Polymeraseaktivitat-aufweisenden Proteinkomplex oder eine Untereinheit 
davon und bildet dadurch eine Klammer urn die Nukleinsaure aus. In jedem 
Fall wind durch diese Klammerbildung die Prozessivitat signifikant gesteigert, 
mindestens urn das Eineinhalbfache (Beispiel 5 und Fig. 23). 

20 

Das heilM, der erfindungsgemalie in ^ro-Komplex besitzt eine mindestens 
eineinhalbfache Prozessivitat im Vergleich zu einem Elongationsprotein alleine, 
beziehungsweise im Vergleich zu einem Polymeraseaktivitat-aufweisenden 
Proteinkomplex, bzw. einer Untereinheit davon, ohne Gleitklammer (Beispiel 5 
25 und Fig. 23). 

Als Glertkammer konnen erfindungsgemafX beispielsweise Homologe oder 
Funktionsanaloge des "Proliferating Cell Nuclear Antigen B -Proteinkomplexes, 
kodiert im menschlichen Genom, oder Homologe des ebenfalls ringformigen 
30 "p-clamp n -Proteinkomplex aus £ coli dienen, welche aus thermostabilen 
Organismen stammen und thermostabil sind. oder sofem sie nicht-thermostabil 
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sind, thermostabil gemacht werden, oder aus nicht thenmostabilen Organismen 
stammen und thermostabil sind bzw. nachtraglich durch VerSnderung der 
Aminosauresequenz thermostabil gemacht werden (Eijsink VG, van der Zee 
JR, van den Burg B, Vriend G, Venema G, FEBS Lett 1991 Apr 22;282(1):13- 
5 16, Improving the thermostability of the neutral protease of Bacillus 
stearothemnophilus by replacing a buried asparagine by leucine, Bertus Van 
den Burg, Gert Vriend, Oene R. Veltman, Gerard Venema, and Vincent G. H. 
Eijsink Engineering an enzyme to resist boiling PNAS 1998 95: 2056-2060). 
Unter homologen Sequenzen soil hierin im folgenden Sequenzen verstanden 

10 werden, die sich dadurch auszeichnen, dalS sie zu einer oder mehreren 
anderen Sequenzen eine Sequenzahnlichkeit aufweisen und zwar in einem 
Malie, bei dem nicht von einer zufalligen Ahnlichkeit ausgegangen werden 
kann. Der Grad der Sequenzahnlichkeit wird in Prozent ausgedriickt und 
Homologie genannt. Bisweilen wird auch der Begriff „Sequenzidentitat" 

15 verwendet. Ein Homolog ist eine Nukleinsaure oder Aminosauresequenz. 
welche zu einer Bezugssequenz eine homologe Sequenz ist. 

Die Gleitklammer kann aus mehreren Komponenten aufgebaut sein. Die im 
menschlichen Genom identifizierte Gleitklammer besteht aus drei PCNA- 
20 Protein Komponenten (SEQ ID NO: 11) (Homotrimeres), die im £ coff-Genom 
identifizierte Gleitklammer besteht aus zwei Komponenten (SEQ ID NO: 35) 
(Homodimeres ). 

Als Gleitklammer im Sinne der vorliegenden Erfindung ist hierbei insbesondere 
25 jedes Protein zu verstehen, das die funktionelle Eigenschaft der 
Polymeraseprozessivitatssteigerung (Beispiel 5 und Fig. 23) besitzt und/oder 
der Senkung der Fehleriate dient. Dazu kann die Gleitklammer eine 
ringfarmige dreidimensionale Struktur aufweisen oder durch Kopplung an ein 
anderes Protein eine ringformige dreidimensionale Struktur bilden, durch die 
30 sie in der Lage ist, ein- und doppelstrangige Nukleinsauren ganz oder teilweise 
zu umschlieBen. 
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Als Gleitklammer im Sinne der voiliegenden Erfindung ist insbesondere ein 
solches Protein zu verstehen, das 

5 1. zu der menschlichen PCNA-Aminosauresequenz (Eukaryonten) 
(SEQ ID NO 11) auf einer Lange von mindestens 100 Aminosauren 
bei einem Sequenzalignment eine mindestens 20 %ige, bevorzugt 
mindestens 25 %ige und noch bevorzugter mindestens 30 %ige 
Sequenzidentitat aufweist Oder das 

10 2. zu der bakteriellen p-clamp-Sequenz aus E. coli (Eubakterien) 
(SEQ ID NO 35) auf einer Lange von mindestens 100 Aminosauren 
bei einem Sequenzalignment eine mindestens 20 %ige. bevorzugt 
mindestens 25 %ige und noch bevorzugter mindestens 30 %ige 
Sequenzidentitat aufweist oder das 

15 3. zu der Aminosauresequenz des PCNA-Homologen aus 
Archaeoglobus fulgidus (Archaebakterien) (SEQ ID NO 12) auf einer 
Lange von mindestens 100 Aminosauren bei einem Sequenzalignment 
eine mindestens 20 %ige, bevorzugt 25 %ige und noch bevorzugter 30 
%ige Sequenzidentitat aufweist. 

20 

Samtliche Sequenzalignments, wie sie hierin offenbart werden, wurden mit 
dem BLAST Algorithmus nach Altschul, S.F., Gish. W. Miller, W., Myers.E.W.. 
and Lipman, D.J., J. Mol. Biol. 215, 403-410 (1990) erstellt. 

25 Die erfindungsgema&e Gleitklammer kann eines oder mehrere der 
vorgenannten Merkmale aufweisen. 



Als Gleitklammer bzw. Gleitklammerproteine im Sinne der voriiegenden 
Erfindung sind auBerdem Proteine zu verstehen, die eine oder beide der 
folgenden Konsensussequenzen (Region 1 und Region 2) beinhalten und an 
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nicht mehr als vier Positionen von der Region 1 (SEQ ID No.:. 39) Oder nicht 
mehr als vier Positionen von der Region 2 (SEQ ID No.: 40) abweichen (Fig. 4): 

Region 1 
5 (SEQ ID No.: 39): 

[GAVLIMPFVv>D-X-X-X-[GAVLIMP^ 

X-[GAVLIMPFW]-X-X-X-X-F.X-X-Y-X-X-D 
und I oder 
Region 2: 
10 (SEQ ID No.: 40): 

[GAVLIMPFW]-X(3)-L-A-P-[KRHDE]-[GAVLIMPFVy|-E 

Die Aminosauren werden hierbei gemaB der Standard IUPAC - Einbuchstaben 
- Nomenklatur benannt und gemaB dem Prosite Pattem- 
15 Beschreibungsstandard aufgefuhrt. Dabei sind die folgenden 
Aminosauregaippen haufig zusammengefaB: 
G,A,V I L,I,M.P,F oder W (Aminosauren mit nicht polaren Seitenketten) 
S.T.N.Q.Y, oder C (Aminosaure mit ungeladenen polaren Seitenketten) 
K.R.H.D oder E (Aminosaure mit geladenen und polaren Seitenketten) 
20 AuBerdem bedeutet X in den Sequenzen bzw. Sequenzprotokollen jede 
beliebige Aminosaure oder Insertion oder Deletion 

Aus dem in Fig. 12 dargestellten multiplen Alignment von menschlichen PCNA- 
Homologen wurde zudem ein Hidden-Markov-Modell generiert. Als 

25 Gleitklammer im Sinne der voriiegenden Erfindung ist somit insbesondere auch 
jedes Protein zu verstehen, das mit dem so erzeugten Hidden-Markov-Modell 
(hierin im folgenden mit „HMM" bezeichnet) einen .Score" von mehr als 20, 
bevorzugt 25 am bevorzugtesten 30 aufweist (Fig. 12), wobei ein „Score" der 
Ausgabewert einer HMM-Analyse ist. Die Hidden-Markov-Modelle und die 

30 entsprechenden Scores wurden mit dem hmmfs Programm (Version 1.8.4, July 
1997) aus dem HMMER-Paket berechnet (HMMER Protein and DNA Hidden 
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Markov Models (Version 1.8) von Sean Eddy, Dept. of Genetics, Washington 
University School of Medicine, St Louis, USA;). 

Markov-Modelle mit verstecktem Profil (engl.: profile hidden Markov models - 
5 profile HMMs), kurz auch „Hidden Markov Models" genannt, hierin als HMM 
abgekurzt, sind statistische Modelle des Konsensus der Primarstruktur einer 
Sequenzfamilie. Die Profile verwenden positionsspezifische Punktzahlen 
^scores") fur Aminosauren (oder Nukleotide) und positionsspezifische 
Punktzahlen zum Eroffnen oder Erweitem einer Insertion oder Deletion. 
10 Methoden zum Erstellen von Profilen, ausgehend von multiplen Alignments, 
wurden von Taylor (1986), Gribskov et al. (1987), Barton (1990) und 
Heinikoff (1996) eingefuhrt. 

HMM stellen eine vollkommen probabilistische Beschreibung von Profilen 

15 bereit, d. h. die Lehre von Bayes legt fest, wie die gesamten 
Wahrscheinlichkeits- (Auswertungs-) Parameter gesetzt werden sollten 
(vergl. Krogh et al. 1994, Eddy 1996 und Eddy 1998). Die zentrale Idee ist 
die, daft ein HMM ein finites Modell ist, das eine 
Wahrscheinlichkeitsverteilung uber eine unbegrenzte Anzahl moglicher 

20 Sequenzen beschreibt. Das HMM setzt sich aus einer Anzahl von Zustanden 
zusammen, die den Saulen eines multiplen Alignments, wie dies 
tiblicherweise dargestellt wird, entsprechen. Jeder Zustand emittiert Symbole 
(Reste) entsprechend den (zustandsspezifischen) Symbol-Emissions- 
Wahrscheinlichkeiten, und die Zustande sind durch Zustand-Obergangs- 

25 Wahrscheinlichkeiten untereinander verbunden. Ausgehend von einem 
Anfangszustand wird eine Abfolge von Zustanden generiert, indem von 
einem Zustand zum anderen entsprechend den Zustands-Ubergangs- 
Wahrscheinlichkeiten ubergegangen wird, bis ein Endzustand erreicht ist 
Jeder Zustand emittiert dann Symbole entsprechend den Emissions- 

30 Wahrscheinlichkeits-Verteilung dieses Zustands, was eine beobachtbare 
Sequenz von Symbolen erzeugt. 
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Das Attribut „hidden" (versteckt) leitet sich ab von der Tatsache, daB die 
zugrunde liegende Zustandssequenz nicht beobachtet werden kann; was 
gesehen wird, ist die Symbolsequenz. Eine AbschStzung der Obergangs- 
5 und Emissions-Wahrscheinlichkeiten (das Trainieren des Modells) wird durch 
dynamische Programmierungsalgorithmen erreicht, die in dem HMMER- 
Paket implementiert sind. 

Wenn ein existierendes HMM und eine Sequenz gegeben sind, kann man die 
10 Wahrscheinlichkeit berechnen, dad das HMM die fragliche Sequenz 
erzeugen konnte. Das HMMER-Paket liefert eine numerische GrfllJe (die 
Punktzahl bzw. Ausgabewert), die proportional zu dieser Wahrscheinlichkeit 
ist, d. h. den Informationsgehalt der Sequenz, angegeben in Bits, gemessen 
gemali dem HMM. 

15 

In Zusammenhang mit HMM sei auf folgende Literaturstellen verwiesen: 
Barton, G.J. (1990) # : 

Protein multiple alignment and flexible pattern matching. 
20 Methods Ezymol. 183:403-427. 

Eddy/S.R. (1996): 

Hidden markov models. 

Curr. Opin. Strct. Biol. 6: 361-365. 

25' 

Eddy, S.R. (1998): 

Profile hidden markov models. 

Bioinformatics. 14: 755-763. 



30 Gribskov, M. McLachlan, A.D. und Eisenberg D. (1987): 

Profile analysis: Detection of distantly related proteins. 
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Proc. Natl. Acad. Sci. USA. 84: 4355-5358. 
Heinikoff, S. (1996): 

Scores for sequence searches and alignment. 
5 Curr. Opin. Strct. Biol. 6: 353-360. 

Krogh, A., Brown, M. f Mian, I.S., Sjolander, K. und Haussler, D. 
(1994): 

Hidden markov models in computational biology: Applications to 
10 protein modelling. 

J. Mol. Biol. 235: 1501-1531. 

Taylor, W.R. (1986): 

Identification of protein sequence homology by consensus template 
15 alignment. 

J. Mol. Biol. 188: 233-258. 

Aus dem in Fig. 13 dargestelten multiplen Alignment von E coli p-clamp- 
Homologen wurde ein HMM generiert. Als Gleitklammer im Sinne der 
20 vorliegenden Erfindung ist somit insbesondere auch jedes Protein zu 
verstehen, das mit dem so erzeugten HMM einen Score von mehr als 25, 
bevorzugt 30 und am bevorzugtesten 35 aufweist (Fig. 13). 

Die Gleitklammer kann aus mehreren Komponenten aufgebaut sein, die durch 
25 eine charakteristische Bindung fest aneinander gebunden sind, so daft ein 
stabiler ringformiger Molekulkomplex gebildet wird, der nicht ohne weiteres von 
der Nukleinsaure dissoziieren kann. Dadurch wird eine feste, aber nicht 
kovalente Bindung an die Nukleinsaure ermoglicht, die die freie 
Verschiebbarkeit auf derselben aber nicht behindert Die 
30 prozessivitatssteigemden Gleitklammerproteine haben zudem charakteristische 
lokale MolekOleigenschaften im Bereich der Wechselwirkungsregion zur DNA, 
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die die freie Verschiebbarkeit erleichtem und die durch in diese Region 
eingelagerte Wassermolekule unterstutzt werden kann. 



Eine bevorzugte Ausfuhrungsform der vorliegenden Erfindung ist weiteriiin 
5 insbesondere ein thermostabiler prokaryontischer in wfro-Komplex. wobei das 
Gleitkiammerprotein eines der folgenden ist: AF 0335 aus Aithaeoglobus 
fulgidus (SEQ ID NO.: 12) (Fig.24). MJ0247 aus Methanococcus jannaschii 
(SEQ ID NO.: 13), PHLA008 aus Pyrococcus horikoschii (SEQ ID NO.: 14), 
MTH1312 aus Methanobaclerium Thermoautotrophicus (SEQ ID NO: 15), 
10 sowie AE000761_7 aus Aqurfex aeolicus (SEQ ID NO.: 36). 

Insbesondere sind solche thermostabilen in wfro-Komplexe Gegenstand dieser 
Anmeldung, wobei das Gleitkiammerprotein eine Aminosauresequenz umfalit, 
die ausgewahlt ist aus der Gruppe, die SEQ ID No. 11, 12, 13, 14. 15 und 36 
15 umfaBt 



Der Gleitklammerlader 

Desweiteren ist als bevorzugte Ausfiihrungsform zu verstehen, wenn der 
erfindungsgemalie Komplex einen Gleitklammerlader umfalit. Als 
Gleitklammerlader wird hierin ein Protein, Proteinkomplex Oder Untereinheit 
eines Proteins verstanden, welches ein Homolog des im Menschen 
identrfizierten "Replication Factor C n -Proteinkomplexes umfaBt. 

Dieser Proteinkomplex besteht im Menschen aus funf Untereinheiten wobei sie 
durch 5 separate Gene im Menschen kodiert sind. Die 4 von jeweils einem Gen 
kodierten kleinen Untereinheiten (hierin als Gleitklammerlader 1 bezeichnet) 
bilden beim Menschen einen Proteinkomplex. Das Protein der grolien 
Untereinheit wird beim Menschen durch ein Gen kodiert (hierin als 
Gleitklammerlader 2 bezeichnet). Die Sequenzen der vier kleinen 
Untereinheiten sind als SEQ ID NO: 1, 32, 33, 34 dargestellt, die Sequenz der 
groBen Untereinheit ist als SEQ ID NO.: 6 dargestellt 
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Als Gleitklammerlader 1 kSnnen erfindungsgemaB Homologe oder 
Funktionsanaloge, einzeln oder in beliebiger Kombination, einer jeden der 
vorstehen genannten Sequenzen SEQ ID NO.: 1, 32, 33. 34 verwendet 
5 werden. Dabei kdnnen die Homologen prokaryontischen, wie eubakteriellen 
oder archaebakteriellen, oder eukaryontischen Ursprungs sein. 

Als Gleitklammerlader 2 kbnnen erfindungsgemaB Homologe oder 
Funktionsanaloge, einzeln oder in beliebiger Kombination, der vorstehend 
10 genannten Sequenz SEQ ID NO.: 6 verwendet werden. Dabei konnen die 
Homologen prokaryontischen, wie eubakteriellen oder archaebakteriellen, oder 
eukaryontischen Ursprungs sein. 

Als Gleitklammerlader 1 im Sinne der voriiegenden Erfindung kann auch ein 
15 solches Protein verstanden werden, das zu der menschlichen (Eukaryonten) 
Aminosauresequenz (SEQ ID NO: 1, 32, 33, 34 ) auf einer Lange von 
mindestens 100 Aminosauren bei einem Sequenzalignment eine mindestens 
20 %ige, bevorzugt mindestens 25 %ige und noch bevorzugter mindestens 30 
%ige Sequenzidentitat aufweist. 

20 

Als Gleitklammerlader 2 im Sinne der voriiegenden Erfindung kann auch ein 
solches Protein verstanden werden, das zu der menschlichen (Eukaryonten) 
Aminosauresequenz (SEQ ID NO: 6) auf einer Lange von mindestens 150 
Aminosauren bei einem Sequenzalignment eine mindestens 20 %ige 
25 Sequenzidentitat, bevorzugt mindestens 25 %ige und noch bevorzugter 
mindestens 30 %ige aufweist. 

Gleitklammerlader-Homologe im Sinne der obigen Definition sind 
beispielsweise die in Fig. 1 aufgefuhrten Gene aus Archaebakterien. Diesen 
30 Genen entsprechen fur den Gleitklammerlader 1 die Sequenzen SEQ ID NO: 
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2. 3, 4, und 5 und fur den Gleitklammeriader 2 die Sequenzen SEQ ID NO- 7 
8,9,und10. 

Als Gleitklammeriader 1 im Sinne der voriiegenden Erfindung kann auch ein 
5 Protein verstanden werden, das eine Sequenz gemalJ der folgenden 
Konsensussequenz umfalJt und an nicht mehr als vier Positionen von dieser 
Sequenz abweicht (Alinierung siehe auch Fig. 6): 

SEQ ID No. 41: 

10 C-N-Y-X-S-[KRHDEhM-X-[GAVLIMPR^^ 
X-P-[GAVLIMPFW] 

Als Gleitklammeriader 2 im Sinne der voriiegenden Erfindung kann auch ein 
Protein verstanden werden, das eine Sequenz gemafi der folgenden 
15 Konsensussequenz umfafJt und an nicht mehr als vier Positionen von dieser 
Sequenz abweicht (Alinierung siehe auch Fig. 7): 

SEQ ID No.42: 

K-X-X-L-L-X-G-P-P-G-X-G-K-T-[STNQYC]-X-[GAVLIMPFW]-X.X- 
20 [GAVLIMPFW] 

Aus dem in Fig. 14 dargestellten multiplen Alignment von Sequenzen des 
Gleitklammertaders 1 umfassend die menschliche Sequenz sowie einige dazu 
homologe Sequenzen aus Archaebakterien, wurde zudem ein HMM generiert. 
25 Als Gleitklammeriader 1 im Sinne der voriiegenden Erfindung ist demzufolge 
auch ein Protein zu verstehen, das mil dem so erzeugten HMM einen Score 
von mehr als 25, bevorzugt mehr als 30 und am bevorzugtesten mehr als 35 
aufweist (Alinierung siehe auch Fig. 14). 

30 Aus dem in Fig. 15 dargestellten multiplen Alignment von Sequenzen des 
Gleitklammeriaders 2 umfassend die menschliche Sequenz sowie einigen dazu 
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homologen Sequenzen aus Archaebakterien wurde zudem ein HMM generiert. 
Als Gleitklammeriader 2 im Sinne der voriiegenden Erfindung ist demzufolge 
auch ein Protein zu verstehen, das mit dem so erzeugten HMM einen Score 
von mehr als 15, bevorzugt mehr als 20 und am bevorzugtesten mehr als 25 
5 aufweist (Alinierung siehe auch Fig. 15). 

Es kann auch vorgesehen sein, daft der erfindungsgemafte in wfro-Komplex 
ein dem Eubakterium Escherichia coli y-Komplex Oder Teilen davon homologes 
Protein als Gleitklammeriader 1 Oder Gleitklammeriader 2 umfaftt. 

10 

Ein Gleitklammeriader im Sinne der voriiegenden Erfindung kann demgemaft 
ein Gleitklammeriader 1 alleine, ein Gleitklammeriader 2 alleine, oder eine 
Kombination einer oder mehrerer Gleitklammeriader 1 bzw. Gleitklammeriader 
2, jeweils wie vorstehend definiert, sein. 

15 

Aulierdem ist in einer Ausfuhrungsform des erfindungsgemaflen 
thermostabilen in itfro-Komplex zur Elongation von Nukleinsauren vorgesehen, 
daft dieser zusatzlich eine Verbindung umfaftt, welche bei der Spaltung 
Energie freisetzt, wie beispielsweise ATP, GTP, CTP, TTP, dATP, dGTP, dCTP 
20 oderdTTP. 



Ohne im folgenden darauf festgelegt sein zu wollen, scheint ein 
Gleitklammeriader die Komponenten der Gleitklammer urn den 
ununterbrochenen DNA-Strang herum zusammenzufugen, bzw. diese wieder 
zu entfemen, wenn die Reaktion beendet ist Dabei kann die Gleitklammer eine 
ringformige dreidimensionale Struktur aufweisen oder durch Kopplung an ein 
anderes Protein eine ringformige dreidimensionale Struktur bilden, durch die 
sie in der Lage ist, ein- oder doppelstrangige Nukleinsauren ganz oder 
teilwseise zu umschlieften. Der Gleitklammeriader kann dann Vorteile mit sich 
bringen, wenn das Template-NukleinsauremolekOI ringformig geschlossen 
voriiegt. 
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Insbesondere sind solche thermostabile in wf/o-Komplexe Gegenstand dieser 
Anmeldung, wobei der Gleitklammeriader 1 eine Aminosauresequenz umfaBt, 
die ausgewahlt ist aus der Gruppe, die SEQ ID No. 2, 3, 4 und 5 umfa&t 

5 

Insbesondere sind solche thermostabile in wfro-Komplexe Gegenstand dieser 
Anmeldung, wobei der Gleitklammerladder 2 eine Aminosauresequenz umfaBt, 
die ausgewahlt ist aus der Gruppe, die SEQ ID No. 7, 8, 9 und 1 0 umfaBt 

10 Das Kopplungsprotein 

Das Kopplungsprotein hat die Funktion, ein Elongationsprotein mit einem oder 
mehreren Gleitklammerproteinen oder einem Gleitklammerproteinkomplex zu 
verbinden. Als Kopplungsprotein im Sinne der voriiegenden Erfindung ist somit 
insbesondere jedes Protein zu verstehen, welches die oben beschriebene 
15 Funktion aufweist. Bevorzugt sind solche Kopplungsproteine, die 
archaebakteriellen Urspmngs sind. 

« 

Kopplungsproteine im Sinne der voriiegenden Erfindung sind beispielsweise 
Homologe oder Funktionsanaloge. einzeln oder in beliebiger Kombination, 

20 einer jeden der in Fig. 1 aufgefuhrten Sequenzen. die Homologe zu der 
humanen Sequenz der kleinen Untereinheit der Polymerase 8, hierin als 
koppelnde Untereinheit bezeichnet (Sequenzname: DPD2_HUMAN, dargestellt 
im Sequenzprotokoll als SEQ ID NO:16), sind. Im Sinne der voriiegenden 
Erfindung kann ein Kopplungsprotein ein Protein sein, das eine Sequenz 

25 umfafit, die aus der Gruppe ausgewahlt ist, die die Sequenzen SEQ ID NO: 17, 
18, 19, 20 und 21 umfafJt. 

Als Kopplungsprotein im Sinne der voriiegenden Erfindung ist insbesondere ein 
solches Protein zu verstehen, das zu der menschlichen (Eukaryonten) 
30 Aminosauresequenz (SEQ ID NO: 16 ) auf einer Lange von mindestens 150 
Aminosauren bei einem Sequenzalignment eine mindestens 18 %ige, 
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bevorzugt mindestens 22 %ige und noch bevorzugter mindestens 26 % ige 
Sequenzidentitat aufweist * 

Als Kopplungsprotein im Sinne der vorliegenden Erfindung ist insbesondere ein 
5 solches Protein zu verstehen, das zu der Aminosauresequenz (SEQ ID NO: 19 
) von Pyococcus horikoshii auf einer Lange von mindestens 150 Aminosauren 
bei einem Sequenzalignment eine mindestens 20 %ige Sequenzidentitat 
aufweist, bevorzugt eine mindestens 25 o/oige Sequenzidentitat und am 
bevorzugtesten eine Sequenzidentitat von mehr als 30 % 

10 

Als Kopplungsprotein im Sinne der vorliegenden Erfindung ist auch jedes 
Protein zu verstehen, das die folgende Konsensussequenz umfafit und an nicht 
mehr als vier Positionen von dieser Sequenz abweicht Die Generierung der 
Konsensussequenz wird in Fig. 5 gezeigt, die als SEQ ID No. 43 hierin 
15 offenbart wird. 



SEQ ID No. 43: 

[FLHGAVLIMPFW]-X-X-^^^ 
f G AVLIMPFW]-X-[GAVLIM^ 

Aus dem in Fig. 16 dargestellten multiplen Alignment von Homologen zur 
menschlichen koppelnden Untereinheit oder Kopplungsprotein wurde zudem 
ein HMM generiert. Als koppelnde Untereinheit im Sinne der vorliegenden 
Erfindung ist somit jedes Protein zu verstehen, das mil dem so erzeugten HMM 
25 e,nen Score mehr als 10, bevorzugt mehr als 15, am bevorzugtesten mehr als 
20 aufweist. 

Insbesondere sind solche thermostabilen in wto-Komplexe Gegenstand dieser 
Anmeldung, wobei das Kopplungsprotein eine Aminosauresequenz umfafit, die 
30 ausgewahlt ist aus der Gruppe, die SEQ ID No. 17, 18, 19, 20 und 21 umfafit 
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Elongationsprotein 

Im Rahmen der vorliegenden Erfindung kann ein Elongationsprotein verwendet 
werden, das die eingangs definierten Merkmale aufweist Dariiber hinaus 
konnen Formen von Elonagtionsproteinen verwendet werden, wie sie im 
5 folgenden beschrieben werden und im Stand der Technik zumindest zum Teil 
bereits bekannt sind. 



Es ist bekannt, daB einige Elongationsproteine die Anwesenheit eines 
Kopplungsproteins benotigen, urn Oberhaupt Polymeraseaktivitat aufeuweisen. 

10 Weiterhin ist bekannt, daB einige Elongationsproteine direkt an 
Gleitklammerproteine binden konnen, wohingegen andere Elongationsproteine 
die Anwesenheit eines Kopplungsproteins fur die Bindung an die 
Gleitklammerproteine benotigen. Weiterhin konnen Elongationsproteine die 
beiden vorstehend genannten Eigenschaft in sich vereinen, das heiBt sowohl 

15 iiber ein Kopplungsprotein als auch direkt, das heiBt ohne ein 
Kopplungsprotein, an ein Gleiklammerprotein binden. 

Bevorzugte Elongationsproteine fQr den erfindungsgemaBen in wfro-Komplex 
konnen ausgewahlt sein aus der Gruppe, die die Organismen 

20 Carboxydothermus hydrogenoformans, Thermus aquaticus, Thermus 
caldophilus, Thermus chliarophilus, Thermus filiformis, Thermus flavus, 
Thermus oshimai, Thermus ruber, Thermus scotoductus, Thermus silvanus, 
Thermus species 205, Thermus species sp. 17, Thermus thermusphilus, 
Therotoga maritime, Therotoga neapolitana, Thermosipho africanus, 

25 Anaerocellum thermophilum, Bacillus caldotenax, oder Bacillus 
stearothermophilus umfaBt, eingebracht wird. 

Als Elongationsproteine sind beispielsweise auch die in Fig. 1 aufgefuhrten 
zum menschlichen Elongationsprotein (SEQ ID NO: 22) homologen oder 
30 funktionsanaiogen Elonagationsproteine aus Archaebakterien geeignet (SEQ 
ID NO: 23, 24, 25, 26). 
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Insbesondere sind solche thermostabile in wlro-Komplexe Gegenstand der 
Erfindung, wobei das Elongationsprotein eine Aminosauresequenz umfa&t, die 
ausgewahlt ist aus der Gruppe, die SEQ ID No. 23, 24. 25, 26, 27, 28, 29, 30 
5 und 31 umfaRt. 

Als Elongationsprotein im Sinne der vorliegenden Erfindung ist insbesondere 
ein solches Protein zu verstehen, das zu der menschlichen (Eukaryonten) 
Aminosauresequenz (SEQ ID NO: 22) auf einer Lange von mindestens 200 
10 Aminosauren bei einem Sequenzalignment eine mindestens 20 %ige 
Sequenzidentitat, bevorzugt 25 %ige Sequenzidentitat, am bevorzugtesten 30 
%ige Sequenzidentitat aufweist. 



Als Elongationsprotein im Sinne der vorliegenden Erfindung ist auch 
15 insbesondere ein Protein zu verstehen, das die folgende Konsensussequenz 
(SEQ ID No. 44) beinhaltet und an nicht mehr als vier Positionen von dieser 
Sequenz abweicht. Die Fig. 8 zeigt das Alignment, das der Konsensussequenz 
zugrunde liegt. 

20 SEQ ID No.44: 

D-[GAVLIMPF\^-[GAVLIMPFW]-X-X-Y-N-X-X-X-F-D-X.P-Y-[GAVLIMPFW^ 
X-R-A 



Aus dem in Fig. 17 dargestellten multiplen Alignment von Homologen zum 
menschlichen Elongationsprotein (SEQ ID NO: 22) wurde zudem ein HMM 
generiert Als Elongationsprotein im Sinne der vorliegenden Erfindung ist somit 
auch ein Protein zu verstehen, das mit dem so erzeugten HMM einen Score 
von mehr als 20, bevorzugt mehr als 25, am bevorzugtesten mehr als 30 
aufweist 
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Als Elongationsprotein im Sinne der voriiegenden Erfindung ist somit auch ein 
seiches Protein zu verstehen. das zu der archaebakteriellen 
Aminosauresequenz (SEQ ID NO: 27) auf einer Lange von mindestens 400 
Aminosauren bei einem Sequenzalignment eine mindestens 25 %ige 
5 Sequenzidentitat, bevorzugt mindestens 30 %ige Sequenzidentitat, am 
bevorzugtesten mindestens 35 %ige Sequenzidentitat aufweist. Beispielsweise 
sind geeignet die aus Archaebakterien stammenden Proteine mit der SEQ ID 
NO: 27, 28, 29, 30 Oder 31. 



10 Als Elongationsprotein im Sinne der voriiegenden Erfindung ist daher 
insbesondere auch jedes Protein zu verstehen, das die folgende 
Konsensussequenz, hierin als SEQ ID No.: 45 bezeichnet, beinhaltet und an 
nicht mehr als vier Positionen von dieser Sequenz abweicht. (Die Fig. 9 zeigt 
das Alignment, das der Konsensussequenz zu Grunde liegt) 

15 

SEQ ID No. 45: 

A-[GAVLIMPFW]-R-T-A-[GA^^ 

G-[GAVLIMPFW]-V-X-A-P-[GAVLIMPFW]-E-G-I-A-X-V-[KRHDE]-I 

t. 

20 Aus dem in Fig. 18 dargestellten multiplen Alignment von Homologen zum 
archaebakteriellen Elongationsprotein (SEQ ID NO: 27) wurde zudem ein HMM 
generiert. Als Elongationsprotein im Sinne der voriiegenden Erfindung ist somit 
insbesondere jedes Protein zu verstehen, dad mil dem so erzeugten HMM 
einen Score mehr als 35, bevorzugt mehr als 40 und noch bevorzugter mehr 

25 als 45 aufweist (Fig. 18). 

Das Elongationsprotein kann auch eubakteriellen Ursprungs sein. 
Als Elongationsprotein im Sinne der voriiegenden Erfindung ist somit ebenfalls 
ein solches Protein zu verstehen, das zu der eubakteriellen 
30 Aminosauresequenz (SEQ ID NO: 37) auf einer Lange von mindestens 300 
Aminosauren bei einem Sequenzalignment eine mindestens 25 %ige, 
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bevorzugt mindestens 30 %ige und noch bevorzugter mindestens 35 %ige 
Sequenzidentitat aufweist. 

Als Elongationsprotein im Sinne der vorliegenden Erfindung ist daher auch 
5 insbesondere jedes Protein zu verstehen, das die folgende Konsensussequenz 
beinhaltet und an nicht mehr als acht Positionen von dieser Sequenz abweicht 
(Fig. 10): 

SEQ ID No. 46: 

1 0 [GAVLIMPFW]-P-V-G-[GAVLIMPFW]-G-R-G-S-X-[GAVLIMPFW]-G-S- 
[GAVLIMPFVv]-V-A-X-A-[GAVLIMPFv^-X-l-T-D-[GAVLIMPFW]-D-P. 

[GAVLIMPFW]-X-X-X-[GAVLIMPFVV]-L-F-E-R-F-L-N-P-E-R-[GAVLIMPFVV]-S- 
M-P-D 

15 Aus dem in Fig. 19 dargestellten multiplen Alignment von Homologen zum 
eubakteriellen Elongationsprotein (SEQ ID NO: 37) wurde zudem ein HMM 
generiert. Als Elongationsprotein im Sinne der vorliegenden Erfindung ist somit 
jedes Protein zu verstehen, das mit dem so erzeugten HMM einen Score von 
mehr als 20. bevorzugt mehr als 25, am bevorzugtesten mehr als 30 aufweist. 

20 

Insbesondere sind solche thermostabile in wfro-Komplexe Gegenstand dieser 
Anmeldung, wobei das Elongationsprotein eine Aminosauresequenz umfalit, 
die ausgewahlt ist aus der Gruppe, die SEQ ID No. 38 umfafit. 

25 Verwendungen des erfindungsgemaBen in Wfro-Komplexes: 

Bisher wurden DNA-Polymerasen als Elongationsproteine ohne 
Kopplungsprotein und ohne Gleitklammer fur Standard-PCR-Reaktionen 
eingesetzt, so z.B. DNA-Polymerase I aus Pyococcus furiosus (US No. 
30 5,545,552) oder Pyrococcus species (EP-A-0 547 359). Diese Enzyme 
zeichnen sich durch die Eigenschaft aus, thermostabil zu sein und haufig eine 
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S'-S'-Exonuklease-Aktivitat (.proof-reading' Aktivitat) zu besitzen. Erst vor 
kurzem wurde ein Heterodimer mit Polymeraseaktivitat in Pyrococcus furiosus 
entdeckt (Uemori, T., Sato, Y., Kato, I., Doi, H., and Ishino, Y. (1997). A novel 
DNA polymerase in the hyperthermophilic archaeon, Pyrococcus furiosus: 
5 gene cloning, expression, and characterization. Genes to Cells 2, 499-512. ) 

Es ist auch m6glich, durch Deletionen oder Mutationen oder durch das Anfugen 
von Aminosauren die Eigenschaften dieser Proteine zu optimieren. Diese 
veranderten Proteine sind ebenfalls Gegenstand der vorliegenden Erfindung, 
10 solange sie den erfindungsgemaiien in vitro Komplex zur Elongation von 
Nukleinsauren bilden und die oben naherspezifizierten Funktionen erfullen. 

Fig. 3 veranschaulicht beispielhaft eine Ausfuhrungsform des 
erfindungsgemaiien thermostabilen in wf/o-Komplexes, wobei hier die 
15 Gleitklammer Qber ein Kopplungsprotein an das Elongationsprotein bindet. 

Der erfindungsgemaBe in wfra-Komplex bzw. der diesen enthaltende 

« 

erfindungsgemSlie Reaktionsansatz, kann desweiteren eine Nukleinsaure 
umfassen, wobei die Nukleinsaure die beispielsweise zu elongierende, zu 
20 sequenzierende, zu amplifizierende oder die revers zu transkribierende 
Nukleinsaure ist und/oder ein Primer, wobei dieser Primer bevorzugterweise an 
eine Nukleinsaure hybridisiert ist. 

Primer sind in der Regel Oligonukleotide, welche komplementar zu einer 
25 Zielsequenz sind, urn an diese binden zu konnen, wobei sie in gegensatzlicher 
Orientierung, ihre 3'-Enden zueinander gerichtet, den zu elongierenden, zu 
sequenzierenden, zu amplifizierenden oder revers zu transkribierenden 
Nukleinsaureabschnitt einschlieBt Sie dienen als Startpunkt der Enzymaktivitat 
und stellen in der Regel ein freies 3'-OH Ende fur die Polymerase zur 
30 Inkoiporation eines Nukleotides zur Verfugung. 
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Wahrend der Verwendung des erfindungsgemaBen thermostabilen /„ vitro- 
Komplexes zur Amplifikafion, Elongation, Reversen Transition und/oder 
Sequenzierung liegt der erfindungsgemaBe Komplex, gegebenenfalls in einem 
Reaktonsansatz. bevorzugterweise in einem geeigneten Puffer vor. Geeignete 
5 Puffer sind solche, die fur PGR, Sequenzierung, Nukleinsauremartaerung und 
andere m v«m-Nukleinsaure-Elongation S reaktionen mittels Polymerase 
Anwendung finden. Geeignete Puffer werden beispielweise beschrieben in 
Methods in Molecular Biology, Vol. 15 Humana Press Totowa, New Jersey 
1993, Hrsg. Bruce A. White. 



10 



Be, der Verwendung des erfindungsgemaBen thermostabilen in vitro- 
Komplexes zur Elongation, Amplifikation, Reversen Transition und/oder 
Sequenziening kann zusatzhch zu dem erfindungsgemaBen Komplex ein 
Nukleotid oder ein Gemisch aus Nuk.eotiden voriiegen bzw. verwendet werden 
15 bzw. umfaBt sein. Deoxynukleotide konnen aus dGTP, dATP, dTTP und dCTP 
ausgewahlt werden, sind jedoch nicht auf diese beschrankt. Zusatzlich konnen 
auch Derivate von Deoxynukleotiden verwendet werden. die als solche 
Deoxynukleotide definiert sind, die in der Lege sind. durch eine thermostabile 
Polymerase in wachsende Nukleinsaure-Molektile inkorporiert zu werden 
20 Solche Derivate umfassen die Thionukleotide. 7*deaza-2' -dGTP 7-deaza-Z - 
dATP, Digoxigenin-dUTP (Boehringer Mannheim>dATP sowie Deoxyinosine- 
Tnphosphat, das auch als Ersatz-Deoxynukleotid fur dATP, dGTP dTTP oder 
dCTP verwendet werden kann, sind aber nicht auf diese beschrankt. Ebenso 
konnen markierte Deoxynukleotide verwendet werden. Auch die Verwendung 
25 von Pyrenen und Pyrenderivaten ist moglich. Alle bekannten und/oder zu dem 
erfindungsgemaBen Zweck geeigneten Markierungen k6nnen dabei voriiegen 
bzw. veiwendet werden. 

Dideoxynukleotide konnen aus ddGTP, ddATP, ddTTP und ddCTP ausgewahlt 
30 werden. sind jedoch nicht auf diese beschrankt. Altemativ konnen auch 
Denvate von Dideoxynukleotiden verwendet werden. die als solche 
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Dideoxynukleotide definiert sind, die in der Lage sind. durch eine Polymerase in 
wachsende Nukleinsaure-MolekQie inkorporiert zu werden, die in der Reaktion 
syn^siert werden. Solche Derivate kfinnen radioaktive DideoxynuWeotide 
(ddATP, ddGTP, ddTTP und ddCTP) se in oder Dideoxynukleotide (ddATP 
5 ddGTP, ddTTP und ddCTP, sein, die m* ,B. FITC, Cy5, Cy5.5, Cy7, Texas- 
Rot oder anderen Farbstoffen markiert sind, sind aber nicht auf diese 
beschrankt. Im Rahmen einer Sequenzierung unter Verwendung des 
erfindungsgemaBen thermostabi,en in Complexes k6nnen auch markierte 

10 L e Z UWe0tide 2USammen "* Unmarkiert6n DideOXynuk,eo « den ^gesetzt 

RibonuWeotide k6nnen aus GTP, ATP, TTP und CTP ausgewahlt werden, sind 
jedoch nicht auf diese beschrankt. Zusatzlich konnen gemalJ der Erfindung 
auch Derivate von Ribonukteotiden veovendet werden, die als solche 
15 R,bonuk,eotide definiert sind, die in der Lage sind, durch eine Polymerase in 
wachsende Nukleinsaure-MolekOle inkorponert zu werden, die in der Reaktion 
synthetisiert werden. Solche Derivate konnen radioaktive Ribonukleotide (ATP 
GTP, TTP und CTP) oder Ribonukleotide (ATP, GTP, TTP und CTP, welche 
mit z.B. FITC. Cy 5 , Cy5.5. Cy7 und Texas-Rot oder anderen markiert sind 
20 umfassen, sind aber nicht auf diese beschrankt. 

Wahrend der Verwendung des Proteinkomplexes zur Ampliation, Elongation 
und Sequenzierung kann es sich als vorteilhaft erweisen, wenn bei der 
Reaktion oder im Reaktionsansatz eine Pyrophosphatase anwesend ist 

25 

Reaktionsansatz umfassend den erfindungsgemaBen thermostabilen in 
Wfro-Komplex: 

WeteMn is, Gegenstand de, vortegenden EdWur* ein ReaKtasansaU. der 
30 den erflndungsgemaSen in WTm-Komplex umfaSt. Dabei kann vorgesehen sein, 
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da* der Reaktionsansatz weiterhin ein oder mehrer Elongationsproteine 
urofaUt die mindestens eine Oder mehrare der vorstehenden Eigenschaften 
Akbvitaten aufweisen. Ein derates zusatliches Elongationsprotein 1st dabei 
vorteilhaftenveise eine thermostabile Polymerase. Ein derartiger 
5 Reaktionsansatz erlaubt eine verglichen mit der Veavendung der bekannten 
thermostabilen Polymerasen erti6hte Prozessivitat, 

Identlfizierung der Gene, Klonierung der Gene, Expression dieser und 
Reinigung der Proteine der erfindungsgemaBen in Wfro-Komplexe: 



10 



In der Regel konnen die Komplexe, bevorzugt vollstandig oder teilweise 
bestehend aus rekombinanten Proteinen, mit den folgenden Schritten 
berertgestellt werden: Beretetellung des Nukleinsaurefragmentes, welches fur 
das gewunschte Protein kodiert. Ligation in einen Expressionsvektor 

15 Transformation in einen Wirt. Expression und Aufreinigung des Proteins (Fig' 
25). In Ubereinstimmung mil der vorliegenden Erfindung kann es vorkommen 
daB Gene, insbesondere aus den Archaebakterien, Interne (Proc Natl Acad. 
ScLUS A 1992 Jun 15;89(12):5577-5581. Intervening sequences in an 
Archaea DNA polymerase gene, Perier FB, Comb DG, Jack WE, Moran LS 

20 Q,ang B, Kucera RB, Benner J. Slatko BE, Nwankwo DO, Hempstead SK ei 
al) enthalten konnen, welche zunachst entfemt werden konnen. 

Die Identlfizierung weitenar fur den erfindungsgemaBen Komplex geeigneter 
Gene und/oder P ro teine kann z.B. erfolgen durch Homologiesuchen in 
25 Datenbanken, welche Genome aus Prokaryonten umfassen. Programme die 
dafur geeignet sind, umfassen beispielsweise das Programm BLAST, BLASTP 
und FASTA, sind aber nicht darauf beschrSnkt. (Altschul. Stephen F. Thomas 
L. Madden. Alejandro A. Schaffer, Jinghui Zhang, Zheng Zhang, Webb Miller 
and David J. Lipman (1997), "Gapped BLAST and PSI-BLAST- a new 
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generation of protein database search programs", Nucleic Acids. Res. 25:3389- 
3402. W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448). 

Die Identifizierung kann auch dadurch geschehen, daB DNA-Sonden 
5 verwendet werden, urn in z.B. gesamtgenomischen Banken aus Prokaryonten 
Oder Eukaryonten nach den entsprechenden Genen zu screenen. Die hierfur 
netigen experimentellen Verfahren finden sich in Maniatis et al. (Molecular 
Cloning (2 nd edition, 3 Volume set): A laboratory Manual, Cold Spring Harbor 
Laboratory Press, N.Y.(1989)) oder in Ausubel et al (Current Protocols in 
10 Molecular Biology, John Wiley and Sons (1988)). 

Die Bereitstellung der gereinigten Nukleinsaure der Gene, die die 
erfindungsgemafien Komplexe aufbauenden Proteine kann z.B. uber deren 
Isoliemng aus einer genomischen Bank des relevanten Orcjanismus 
15 geschehen oder durch synthetische DNA-Herstellung, jeweils gewunschtenfalls 
kombiniert mit einer Amplifikation mittels PCR, unter Zuhilfenahme von 
Primem, welche fur den gewunschten Genabschnitt spezifisch sind. Obliche 
Verfahren sind in Maniatis et al. (Molecular Cloning: A laboratory Manual, Cold 
Spring Harbor Laboratory Press, N.Y. (1989)) beschrieben 

20 

Die Gene der Proteine der erfindungsgemalien in wr/o-Komplexe konnen unter 
Anwendung einer Vielzahl von Methoden kloniert werden und somit mittels 
eines Expressionsvektors zur Proteinexpression in einem Wirtsorganismus zur 
VerfQgung gestellt werden. Gangige Verfahren sind in Maniatis et al. (Molecular 

25 Cloning: A laboratory Manual, Cold Spring Harbor Laboratory Press. 
N.Y.(1989)) beschrieben. Die Gene der Komplexe konnen hierbei z.B. 
zunachst in einen ,high-copy' Vektor, z.B. pUC18, pBst oder pBR322 kloniert 
werden und dann erst in einen prokaryontischen Expressionsvektor. z.B 
P Trc99, pQE30, pQE31 oder pQE32, umkloniert werden. oder aber direkt in 

30 einen prokaryontischen oder viralen Expressionsvektor kloniert werden. Unter 
Vektoren sind hierbei Nukleinsauren zu verstehen. die in der Lage sind, ein 
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anderes NukleinsauremolekGI in oder zwischen verschiedenen Organismen 
bzw. genetischen Hintergrtinden zu transportieren. Sie haben in der Regel die 
Fahigkeit zur autonomen Replikation und/oder zur Expression 
(Expressionsvektorsn) des operativ verbundenen Nukleinsauremolekuls 
5"Operativ verbunden" bedeutet hierin, dafS das transporberte 
NukleinsauremolekQI so mit dem Vektor verbunden ist, daS es unter der 
Transitions- und Translationskontrolle von Expressionskontrollsequenzen 
des Vektors steht und in einer Wirtszeile exprimiert werden kann. Bakterielle 
und v,rale Expressionssysteme, deren bevorzugte Verwendung, sowie eine 
10 Auswah. an Vektorsystemen ist z.B. in ,Gene Expression Technology, (Meth 
Enzymol., Vol 185, Goeddel, Ed., Academic Press, N.Y. (1990)) beschrieben 
Gee,gnete Vektoren fur die vorfiegende Erfindung sollten eine unterschiedlich 
starve Expression der Proteine dadurch ermoglichen, dad sie einige oder alle 
der folgenden Eigenschaften besteen: (1) Promotoren oder 
15 Transkriptionsinitiationsstellen, entweder unmittelbar neben dem Start des 
Proteins oder ais Fusionsprotein, (2) Operator, verwendet werten konnen 
urn d.e Genexpression an oder aus zu schalten, (3) ribosomale Bindungsstellen 
fur e.ne verbesserte Translation, und (4) Terminationsstellen fur die 
Transition oder Translation, die zu verbesserter Stabilitat des Transkriptes 
20 fuhren. 



Express.onsvekto re n, die mit eukaryontischen Zellen, bevorzugterweise mit 
Vertebratenzellen kompatibel sind, konnen auch Verwendung finden Einige 
bekannte Vektoren sind pSVL und pKSV-10 (Pharmacia), pBPV-1/ pM L2d 
25 (International Biotechnologies, Inc.). pAcHLT-ABC (Pharmingen) und pTDT1 
(ATCC 31255). Die Verwendung eines retroviralen Expressionsvektors ist auch 
moglich. 

Wertere Gegenstande der voriiegenden Erfindung sind daher DNA-Sequenzen 
30 welche fur die erfindungsgemalien thermostabilen in ^Komplexe codieren' 
sow,e entsprechende Vektoren, vorzugsweise Expressionsvektoren 
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Dm erfindungsgemaBen Vektoren enthalten mindestens ein Gen fur das 
Glertklammerprotein Oder mindestents ein Gen fOr das Kopplungsprotein oder 
mmdestenseinGenfureinenGleitJdammeriaderl und/oder 2 oder mindestens 
5 em Gen fur ein Elongationsprotem. In einer Ausfuhrungsform enthalten die 
Vektoren gleichzeitig mehrere der verschiedenen vorstehend genannten Gene 
beispfelsweise die Gene fur ein E.onga«onsprotein und ein 
Glertklammerprotein. 

10 Es ist dabei im Rahmen der Erfindung bevorzugt, wenn der Vektor neben den 
dann bereits enthaltenen DNA-Sequenzen noch gee ignete 
Restriktionsschnittsteilen und ggf. Polylinker zur Insertion weiterer DNA- 
Sequenzen enthait. Besonders bevorzugt ist es, wenn die rSumliche 
Anordnung von bereits enthaltener DNA-Sequenz und zusatzlicher 

15 Insertionsstelle nach Expression zur Ausbildung eines Fusionsproteins fQhrt. 

Ebenfalls bevorzugt ist es, wenn der erfindungsgemaBe Vektor Promotor- 
und/oder Operatorbereiche enthait. wobei es besonders bevorzugt ist wenn 
derartige Promoter- und/oder Operatorbereiche induzierbar oder repnmierbar 
20 s,nd. Dadurch wird eine Steuerung der Expression in Wirtszellen erheblich 
vereinfacht und kann besonders effizient gestaltet werden. 

Derartige Promotor/Operatorbereiche konnen in einem Expressionsvektor auch 
mehrfach vortommen, so daft ggf. eine unabhangige Expression mehrerer 
25 DNA-Sequenzen unter Ve-wendung nur eines Expressionsvektors ermog.icht 
wird. 



E.n weiterer Gegenstand der vorliegenden Erfindung ist eine Wirtszelle 
enthaltend einen oder mehrere erfindungsgemaBe(n) Vektorfen), wobei in 
30 d,eser Wrtszelle unter geeigneten Bedingungen die Expression zu Proteinen 
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lonenaustauschchromatographie, Methoden die sich die unterschiedliche 
Hydrophobie zunutze machen. wie mverse-pnase HPLC (High Performance 
L.quid Chromatography), Methoden. die sich bestimmte Affinitaten zunutze 
machen, wie Affinitatschromatographie (Beispiel 6, 7 Fig. 24 und Fig 25) und 
5 Methoden, die sich Unterschiede im isoelektrischen Punkt zunutze machen 
w,e .soelektrische Fokussierung. Es ist auch vorsteilbar, dad Zeilextrakte 
entweder aus dem Organismus, welcher das Gen des akzessorischen 
Kompiexes tragt, gemacht werden konnen, weicher die erfindungsgemaBe 
Aufgabe erfullt. oder aus dem rekombinanten Wirtsorganismus, z.B. E coli Mit 
10 d,esen Extraktionen konnte man andere Reinigungsschritte vermeiden. 

Die oben beschriebenen Verfahren konnen in einer Vielzahl von 
Kombinationen eingesetzt werden, urn die Proteine des in Complexes 
bereitzustellen. 

15 

Elongation von Nukleinsauren 

Der erfindungsgemalie thermostabile in wfro-Komplexe kann zur Eiongation 
von Nukleinsauren verwendet werden, z. B. zur Polymerase-Ketten-Reaktion 
20 (Be,spiel 3. 4, sowie Fig. 21; Fig. 22) DNA-Sequenaerung, zur Markierung 
von NukJeinsauren und anderen Reaktionen, die die in vitro Synthese von 
Nukleinsauren beinhalten. 

Ein weiterer Gegenstand der voriiegenden Erfindung ist daher ein Verfahren 
25 zur Tempiate-abhangigen Elongation von Nukleinsauren, wobei die 
Nukleinsaure notigenfalls denaturiert, mrt mindestens einem Primer unter 
Hybridisierungsbedingungen versehen wird, wobei der Primer hinreichend 
komplementar zu einem flanWerenden Bereich einer gewOnschten 
Nuklemsauresequenz des Template-Strangs ist und mit HHfe einer Polymerase 
30 ,n Anwesenheit von Nukleotiden eine Pnmer-Elongation erfolgt, wobei als 
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Polymerase ein erfindungsgemaBer thermostabiler in w^Komplex eingesetzt 
wird. 

Verfahren zur Template-abhangigen Elongation von Nukleinsauren, bei denen 
5 d,e Elongation ausgehend von einem Primer erfolgt, der an die Template- 
Nukleinsaure anhybridisiert wurde und ein freies 3'-OH-Ende fur die Elongation 
zur Verfugung stellt, sind dem Fachmann bekannt Zur Ampliation wi* 
.nsbesondere eine PCR-Polymerasekettenreaktion duichgefuhrt. 

10 Reverse Transkription 

Es ist auch die Anwendung des erfindungsgemaBen thermostabBen in-vitro- 
Komplexes in der reversen Transkription moglich. wobei entweder der 
erfindungsgemaBe Komplex selbst Reverse-Transkriptase-Aktivitat bestet 
Oder aber zusatzlich ein geeignetes Enzym hinzugefugt wlrd, das eine 
15 Reverse-Transkriptase-Aktivitat aufweist, unabhangig davon ob der 
thermostabile in Complex selbst eine Reverse-Transkriptase-Aktivrtat hat. 

Zur erfindungsgemafi bevorzugten reversen Transkription von RNA in DNA 
wrd ebenfalls ein erfindungsgemaBer thermostabiler in Complex 

20 emgesetzt, wobei dessen Elongationsprotein selbst eine Reverse 
Transkriptase-Aktivitat aufweist. Diese Reverse Transkriptase-Aktivitat kann die 
e.nz ig e Polymeraseaktivitat des Elongationsproteins sein, kann aber auch 
zusatzlich zu einer vorhandenen 5'-3'-DNA-Polymeraseaktivitat vorfiegen Eine 
erfindungsgemaB bevorzugte Ausfuhrungsform des in v/fro-Komplex umfaBt 

25 das Elongatonsprotein aus dem Organismus Cariooxydothermus 
hydrogenoformans, wie offenbart in EP-A 0 834 569. 



Sequenzierung 
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Eine weitere bevorzugte Verwendung des erfindungsgemaaen in vitro- 
Komplexes ist die Sequenzierung von Nukleinsauren gemaB der Methode von 
Sanger. Ausgehend von mindestens einem Primer, der zu einem Teil der zu 
sequenzierenden Nukleinsaure hinreichend komplementar ist, wird eine 
5 Template-abhangige Elongation vorgenommen. Im Falle der Sequenzierung 
von RNA ist es n6tig, eine reverse Translation durchzufuhren. Als 
Deoxynukleotide oder Dideoxynukleotide werden im Rahmen dieser 
bevorzugten Ausfuhrungsfbrm auch die oben beschriebenen jeweiligen 
Derivate als geeignet angesehen. Insbesondere ist es fur die 
10 erfindungsgemalJen Verfahren zur Elongation von Nukleinsauren bevorzugt, 
daB die gebildeten Nukleinsauren markiert werden. Hierzu ist es moglich,' 
markierte Primer und/oder markierte Deoxynukleotide und/oder markierte 
Dideoxynukleotide und/oder markierte Ribonukleotide oder jeweils 
entsprechende Derivate. wie sie oben bereits beispielsweise beschrieben sind, 
15 einzusetzen. 



Markierung von Nukleinsauren 

Ein weiterer Gegenstand der vorliegenden Erfindung ist ein Verfahren zur 
20 Markierung von Nukleinsauren, z.B. durch Einfiigung einzelner Briiche in 
Phosphodiesterbindungen der Nukleinsaurekette und Ersatz eines Nukleotids 
an den Bruchstellen durch ein markiertes Nukleotid mit Hilfe einer Polymerase, 
wobei als Polymerase ein erfindungsgemafier thermostabiler in v/fro-Komplex 
eingesetztwird. 

25 

Ein bevorzugtes Verfahren stellt das allgemein als Nick-Translation 
bezeichnete Verfahren dar, das eine einfache Markierung von Nukleinsauren 
ermoglicht. Alle oben bereits beschriebenen marWerten Ribonukleotide oder 
Deoxyribonukleotide oder Derivate davon sind hierfiir geeignet, solange die 
30 Polymerase sie als Substrat akzeptiert. 
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Eine bevorzugte Ausfuhrungsform des erfindungsgemaBen Kits ist ein Kit zur 
Sequenzierung von Nukleinsauren, wobei zusatzlich zu Deoxynukleotiden 
bzw. deren Derivaten, Dideoxynukleotide bzw. deren Derivate zur 
5 Kettentermination umfaBt sind. 

Desweiteren ist insbesondere Gegenstand der vorliegenden Erfindung ein Kit 
zur reversen Transkrition von Nukleinsauren, wobei entweder der 
erfindungsgemaBe Komplex selbst reverse Transkriptase-Aktivitat besitzt 
10 Oder aber zusatzlich ein geeignetes Enzym anwesend ist, das reverse 
Transkriptase-Aktivitat besitzt, wobei Deoxynukleotide bzw. deren Derivaten 
im Reaktionsgemisch enthalten sein konnen. 

In einer weiteren besonders bevorzugten Ausfuhrungsform enthalt der Kit 
15 Primer und/oder Deoxynukleotide und/oder Dideoxynukleotide und/oder 
Ribonukleotide und/oder deren jeweilige Derivate in markierter Form. 

Insbesondere fur die Sequenzierung von Nukleinsauren ist es notig, eine 
Markierung einzufiigen. Geeignete Markierungen sind weiter oben bereits in 
20 beispielhafter Form beschrieben. Geeignete Markierungsmittel sind in einer 
bevorzugten Ausfuhrungsform des erfindungsgemaBen Kits umfaBt. 

Im Rahmen der vorliegenden Erfindung ist es weiterhin m6glich, daB der Kit 
(hierin auch als Reagenzienkit bezeichnet) zur Markierung von 
25 Nukleinsauren eingesetzt wird. In diesem Fall enthalt der Reagenzienkit die 
Bestandteile a) Oder b) und markierte Nukleotide, wobei Puffersubstanzen, 
ATP oder andere Kofaktoren und/oder Pyrophosphatase ebenfalls anwesend 
sein konnen. 
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insbesondere 1st ein Kit bevorzugt, der einen geeigneten Puffer umfaBt, wie 
oben beschrieben. Bevorzugt ist ebenfalls, daB der erfindungsgemaBe Kit 
zusatzlich eine Pyrophosphatase, ATP und/oder andere Kofaktoren umfaBt. 

5 Gegenstand der vorliegenden Erfindung ist desweiteren die Verwendung 
ernes thermostabilen Gleitklammerproteins in in vitro Verfahren zur 
Elongation, Amplifikation, Markierung bzw. Sequenzierung oder reversen 
Transkription von NukleinsSuren. 

10 Der erfindungsgemaBe thermostabile in vtfro-Komplex kann zu Zwecken der 
Sequenzierung, Amplifikation. reversen Transkription und dergleichen sowohl 
m.t kurzen als auch mit langen Nukleinsaurefragmenten verwendet werden 
wobei insgesamt ejne vem . ngerte FehIerh „ ufjgkej ; 

(Nukleotidfehlinkorporation) gegenuber der Verwendung thermostabiler 
15 Elongationsproteine alleine erreicht wird. 

In einer bevorzugten Alternative wird der thermostabile /* wfro-Komplex zu 
Zwecken der Sequenzierung, Amplifikation und reversen Transkription von 
langen Nukleinsaurefragmenten verwendet. 

20 

In einer weiteren bevorzugten Alternative wird der thermostabile in vitro- 
Komplex zu Zwecken der Sequenzierung, Amplifikation und reversen 
Transkription von solchen Nukleinsaurefragmenten verwendet, die 
Sekundarstruktur ausbilden. 

25 

Die folgenden Beispiele sollen in Verbindung mit den Figuren die Erfindung 
naher erlautern und Vorteile veranschaulichen: 



Figuren: 
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lm folgendenden werden haufig Sequenznamen verwendet, unter denen die 
Protein- oder Nukleinsauresequenzen in der Genbank und der EMBL 
Datenbank stehen. Dabei zeigt: 



en in 



5 Fig. 1 tabellarisch Proteinsequenznamen des erfindungsgemaB, 
wto-Komplexes, sowie Werte aus paarweisen Alignments und multiplen 
Alignments zwischen Archaebakterien und zwischen Archaebakterien und 
den entsprechenden humanen Genen; 

10 Fig. 2 eine Tabelle ahnlich der von Fig. 1. jedoch beschrankt auf 
Gleitklammerprotein und Elongationsprotein von E. coli und A. aeolicus; 

Fig. 3 eine schematised Dartstellung des erfindungsgemalien 

thermostabilen in v/rVo-Komplexes; 

15 

Fig. 4 Alignments zweier konservierter Regionen des 
Gleitklammerproteins; 

Fig- 5 ein Alignment einer konservierten Region des 
20 Kopplungsproteins; 

Fig- 6 ein Alignment einer konservierten Region des 
GleitklammerJaders; 

25 Fig. 7 ein Alignment einer konservierten Region des 
Gleitklammeriaders 2; 

Fig- 8 ein Alignment einer konservierten Region des 
Elongationsproteins 1; 

30 
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Fig-9 ein Alignment einer konservierten Region des 
Elongationsproteins 2; 



Fig. 10 ein Alignment einer konservierten Region des 
5 Elongationsproteins aus Eubakterien; 



Fig. 1 1 ein Alignment einer konservierten Region der Gleitklammer aus 
Eubakterien; 



10 Fig. 12 bis 19 multiple Alignments verschiedener Proteinsequenzen zur 
Generierung von Hidden Markov Modellen (HMM); 

Fig. 20 eine chromatographische Analyse einer rekombinanten 
Gleitkammer (Archaeoglobus fulgidus PCNA (AF 0335))- 

15 

Fig. 21 und 22 das Ergebnis einer PCR unter Verwendung eines 
Elongationsproteins, wie es Bestandteil eines erfindungsgemaRen 
thermostabilen in wfro-Komplexes ist; 

20 Fig. 23 den Vergleich der Aktivitat eines Elongationsproteins mit und 
ohne Gleitklammerprotein; 

Fig. 24 das Resultat der Reinigung eines Gleitklammerproteins; 

25 Fig. 25 die Expression und Reinigung der Archaeoglobus fulgidus- 
DNA-Polymerase; 

Fig. 26 die Ergebnisse der Verwendung eines erfindungsgemafien in 
wfro-Komplexes in der PCR; 

30 

Fig. 27 die Ergebnisse eines Y2H Experimentes; 
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Fig. 28 das PCR-Amplifikationsergebnis des humanen Kollagen-Gens 
unter Verwendung des erfindungsgemaBen thermostabilen in wto-Komplex 

5 Fig. 29 eine tabellarische Obersicht derjenigen Gene, wie sie den in 
Fig. 1 angegebenen Proteinsequenznummern entsprechen und aus den 
jeweiligen Datenbanken erhalten werden konnen; und 

Fig. 30 eine tabellarische Darstellung der Hintergrundinformation zu 
0 den verschiedenen Datenbanken in englischer Sprache, aus denen die hierin 
angegebenen Nukleinsauresequenz- und Aminosauresequenzdaten erhalten 
werden konnen. 



Detaillierte Beschreibung der Figuren 

15 

Fig. 1: 

Figur 1 listet tabellarisch Proteinsequenznamen des erfindungsgemaBen 
thermostabilen in wfro-Komplexes auf sowie Werte aus paarweisen 

20 Alignments und multiplen Alignments zwischen Archaebakterien und 
zwischen Archaebakterien und den entsprechenden humanen Genen. 
Hierbei bedeutet die Annotation „ 1 " die Prozentidentitat (%) zu dem 
entsprechneden humanen Gen, berechnet aus dem paarweisen Alignment 
(siehe Figuren) mit BLASTP 2.0.4 [Feb-24-1998] und die Annotation „ 2 " 

25 Prozentidentitat zu dem entsprechneden Gen von Archaeoglobus fulgidus, 
berechnet aus dem paarweisen Alignment (siehe Figuren) mit BLASTP 2.0.4 
[Feb-24-1998] und die Annotation „ 3 " Prozenzidentitat zu dem 
entsprechneden humanen Gen, berechnet aus dem paarweisen Alignment 
mit FASTA 3.1t02 [March, 1998]«. Die Verfahren werden naher beschrieben 

I0 in: Altschul, Stephen F., Thomas L. Madden, Alejandro A. Schaffer, Jinghui 
Zhang. Zheng Zhang, Webb Miller, and David J. Lipman (1997), "Gapped 
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BLAST and PSI-BLAST: a new generation of protein database search 
programs", Nucleic Acids Res. 25:3389-3402 und W.R. Pearson & D.J. 
Lipman Proc. Natl. Acad. Sci. (1988) 85:2444-2448. Die Fig. 1 zeigt im Falle 
des Gleitklammerladers 1, des Gleitklammeriader 2, des Gleitklammer, des 
5 Kopplungsprotein und des Elongationsprotein 1 die Sequenznamen aus den 
Datenbanken und ebenso deren SEQ ID Nummer. wobei die Werte in den 
Klammern jeweils Prozent Identat je Anzahl Aminosauren darstellen. Im Falle 
des Elongationsprotein 2 beziehen sich die Werte auf Prozent 
Sequenzidentitat zu der Archaeoglobus fulgidus- Sequenz. Auch hier sind die 
10 Sequenznamen aus den Datenbanken und ebenso deren "SEQ ID No." 
gezeigt. 

Fig. 2: 



15 Fig. 2 zeigt Proteinsequenzen, paarweise Alignments und multiple 
Alignments aus Eubakterien des Replikationsapparates. Wobei die 
Annotation 1 %ldentitat zu dem entsprechneden Gen aus E. coli bedeutet, 
berechnet aus dem paarweisen Alignment (siehe Anhang) mit BLASTP 2.0.4 
[Feb-24-1998]#. Das Verfahren wird in: Altschul, Stephen F. f Thomas L. 

20 Madden, Alejandro A. Schaffer, Jinghui Zhang, Zheng Zhang, Webb Miller, 
and David J. Lipman (1997), "Gapped BLAST and PSI-BLAST: a new 
generation of protein database search programs", Nucleic Acids Res. 
25:3389-3402, naher beschrieben. 

25 Fig. 3: 

Fig. 3 zeigt eine Skizze einer moglichen Form des erfindungsgemaBen 
thermostabilen in wto-Komplexes, wobei die Gleitkammer iiber ein 
Kopplungsprotein an das Elongationsprotein bindet. 
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Fig. 4: 

Fig. 4 zeigt Alignments zweier konservierter Regionen des 
Gleitklammerproteins, sowie die daraus hergeleiteten Konsensussequenzen. 
5 Folgende Gene sind gezeigt: PCNA human (aus SEQ ID NO: 11) und die 
entsprechenden Sequenzen aus Arthaeoglobus fulgidus (aus SEQ ID NO: 
12), aus Methanococcus janashii (aus SEQ ID NO: 13), aus Pyrococcus 
horikoschii (aus SEQ ID NO: 14) und aus Methanococcus 
thermoautothrophicus (aus SEQ ID NO: 15). 

10 

Fig. 5: 

Fig. 5 zeigt ein Alignment einer konservierten Region des Kopplungsproteins 
sowie die daraus hergeleiteten Konsensussequenzen. Folgende Gene sind 
15 gezeigt: PfuORF2, DPD2_HUMAN, AF1790 und MJ0702. Die SEQ ID 
Nummern konnen Fig. 1 entnommen werden. 

Fig. 6: 

20 Fig. 6 zeigt ein Alignment einer konservierten Region der koppelnden 
Untereinheit sowie die daraus hergeleiteten Konsensussequenzen. Folgende 
Gene sind gezeigt: AC1 1JHUMAN, AF2060 , MTH0241, PHBN012 und 
MJ1422. Die SEQ ID Nummern konnen Fig. 1 entnommen werden. 

25 Fig. 7: 

Fig. 7 zeigt ein Alignment einer konservierten Region des Gleitklammerlader 
2 sowie die daraus hergeleiteten Konsensussequenzen. Folg nde Gene sind 
gezeigt: AC15_HUMAN, MJ0884 , AF1195. MTH0240 und MTH0240. Die 
30 SEQ ID Nummern konnen Fig. 1 entnommen werden. 
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Fig. 8: 



Fig. 8 zeigt ein Alignment einer konservierten Region des 
5 Elongationsproteins 1, sowie die daraus hergeleiteten Konsensussequenzen. 
Folgende Gene sind gezeigt: DPOD_HUMAN, MJ0885 , MTH1208, 
PHBT047und DPOL.ARCFU. Die SEQ ID Nummern konnen Fig. 1 
entnommen werden. 

10 Fig. 9: 



Fig. 9 zeigt ein Alignment einer konservierten Region des 
Elongationsproteins 2, sowie die daraus hergeleiteten Konsensussequenzen. 
Folgende Gene sind gezeigt: AF1722, MJ1630 , PfuORF3, MTH1536 und 
15 PHBN021. Die SEQ ID Nummern konnen Fig. 1 entnommen werden. 

Fig. 10: 



Fig. 10 zeigt ein Alignment einer konservierten Region des 
20 Elongationsproteins aus Eubakterien sowie die daraus hergeleiteten 
Konsensussequenzen. Folgende Gene sind gezeigt: DP3A_ECOLI: DNA Pol 
III, alpha subunit, Escherichia coli, BB0579: DNA Pol III, alpha subunit, 
Borrelia burgdorferi, DP3A_HELPY: DNA Pol III, alpha subunit, Helicobacter 
pylori AA50: Aquifex aeolicus, section 50 und DP3A_SALTY: DNA Pol III, 
25 alpha subunit, Salmonella typhimurium). 

Fig. 11: 



Fig. 1 1 zeigt ein Alignment einer konservierten Region der Gleitklammer au 
Eubakterien sowie die daraus hergeleiteten Konsensussequenzen. Folgendi 
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Gene sind gezeigt: AAPOL3B, DP3B_ECOLI, S.TYPHIM. DP3B_PROMI, 
DP3B_PSEPU und DP3B_STRC0 (AAP0L3B: Aquifex aeolicus sektion 93: 
DP3B_ECOLI : DNA Pol III, beta chain, Escherichia coli S.TYPHIM: DNA Pol 
III, beta chain, Salmonella typhimurium P3B_PROMI : DNA Pol III, beta 
5 chain, Proteus mirabilis DP3B_PSEPU: DNA Pol III, beta chain, 
Pseudomonas putida DP3B_STRCO: DNA Pol III, beta chain, Streptomyces 
coelicolor). 

Fig. 12: 

10 

Fig. 12 zeigt ein multiples Alignment der Gleitklammerprotein-Sequenzen zur 
Generierung des HMM. 

Fig. 13: 

15 

Fig. 13 zeigt ein multiples Alignment der eubakteriellen Gleitklammerprotein- 
Sequenzen zur Generierung des HMM (AAPOL3B: Aqufex Aeolicus sektion 
93: DP3B_ECOLI : DNA Pol III, beta chain. Escherichia coli S.TYPHIM: DNA 
Pol III, beta chain, Salmonella typhimurium P3B_PROMI : DNA Pol III, beta 
20 chain, Proteus mirabilis DP3B_PSEPU: DNA Pol III, beta chain, 
Pseudomonas putida DP3B_STRCO: DNA Pol III, beta chain, Streptomyces 
coelicolor). 



25 Fig. 14: 



Fig. 14 zeigt ein multiples Alignment der Gleitklammeriader 1- 
Proteinsequenzen zur Generierung des HMM. 
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Fig. 15: 



Fig. 15 zeigt ein multiples Alignment der Gleitklammerlader 2- 
Proteinsequenzen zur Generierung des HMM. 

5 

Fig. 16: 



Fig. 16 zeigt ein multiples Alignment der Proteinsequenzen der 
Kopplungsproteine zur Generierung des HMM. 

10 

Fig. 17: 



Fig. 17 zeigt ein multiples Alignment der Sequenzen der Elongationsproteine 
1 zur Generierung des Hidden Markov Models. 

15 

Fig. 18: 



Fig. 18 zeigt ein multiples Alignment der Sequenzen der Elongationsproteine 
2 zur Generierung des Hidden Markov Models. 

20 

Fig. 19: 



F.g. 19 zeigt ein multiples Alignment der Sequenzen der eubakteriellen 
Elongationsproteine zur Generierung des HMM. Folgende Gene sind gezeigf 
25 DP3AECOLI: DNA Pol III, alpha subunit, Escherichia coli. BB0579: DNA Pol 
HI. alpha subunit, Borrelia burgdorferi, DP3A.HELPY: DNA Pol III alpha 
subunit, Helicobacter pylori AA50: Aquifex aeolicus. section 50 und 
DP3A_SALTY: DNA Pol III, alpha subunit, Salmonella typhimurium) 
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Fig. 20: (Beispiel 2) 

Fig. 20 zeigt eine chromatographische Analyse von rekombinatem 
Archaeoglobus fulgidus PCNA (AF 0335): 

Rekombinantes Archaeoglobus fulgidus-PCNA (AF 0335) liegt unter nativen 
5 Bedmgungen a.s Tnmer vor. Fig. 20 A zeigt Proteine mit His-Tag (HistJdin- 
Tag) ,n den Fraktionen 15 (Spur 1), 17 (Spur 2), 19 (Spur 3), 21 (Spur 4) 23 
(Spur 5). 25 (Spur 6) der ohne Hamstoff durchgefuhrten Chromatography 
F.g. 20B zeigt Proteine mit His-Tag in den Fraktionen 10 (Spur 1) li(Sour 
2). 12 (Spur 3), 13 (Spur 4),14 (Spur 5),15 (Spur 6), 16 (Spur ^(Spur 8) 
10 der In Anwesenheit von Hamstoff durchgefuhrten denatunerenden 
onromatographie. 

Fig. 21: (Beispiel 3) 

Fig. 21 zeigt das Ergebnis einer PGR unter Verwendung eines 
15 Bongationsproteins, wie es Bestandtei. eines erfindungsgemaAen 
thermostabilen in wfro-Komplexes ist: 

Jeweite 1 Ml (Spur 4), 2,5 p. (Spur 5) und 5 p, (Spur 6) Pyococcus norikoshii 
DNA-Polymerase (PH1947; Grobextrakt s. Fig. 25) wurden zum 
Akt,vit a tsvergleich mrt 1 Einheit Tag Polymerase (Spur 2) und 1 p, 
20 Archaeoglobus fulgidus DNA-Polymerase (AF 0497)-Grobextrakt (s Fig 25) 
(Spur 3) individuel. in Standard PGR Reaktionen eingesetzt, Spur 1 zeigt 
e.nen DNA-GroBenmarker (New England Bio.abs; Mischung aus 1 kb DNA 
ladder und 1 00 bp DNA ladder). 

25 Fig. 22: (Beispiel 4) 

Fig- 22 zeigt das Ergebnis einer PGR unter Verwendung eines 
Elongafcnsproteins. wie es Bestandteil eines erfindungsgemaAen 
tnermostabilen in wfro-Komplexes ist: 

Proben der PCR m Archaeogiobus MgUu, DNA-Poiymerase AF 0497 
30 wurde nach unterschiedlichen Zyklenzahto (2) entnommen end auf einem 
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. « ' P ' 2) W,cm * «! Spur aatt 

36Z. spur 10: 38* Spur „: 40Z; Spur , ^ einen DNA GroOennLr 
adder,. Der ebere Atschnift zeigt ReaMenspnaauMe der Taq p " 

10 Fig. 23: (Beispiel 5) 

o F l 2 G,^ e ' nen **" *" Eto "»*~s m» und 

pl ,Tr~ Pn0t>e 1 ' mM «W— Ansau 
Prcben 2-,2 e„ lhte „e„ auaerden, je 3 M , einer 1,000 VeniOnnung einer 
'5 Fratoen von rekomblnanler I^B^ftJL. 
(Ausoangtentration 7,5 pg/p„. Proben 3 . 7 sowie w 2 auRe „, em . 
2. 4 und 8 p, einer FrakUo „ v„, rekombinantem ^ 

ZZ° S 7: PCNA ' — * A.DA 

Hmtergnrnd Spur ,: 46,4; Spur 2= 258 ,5; Sp,, 3= ,64,4; Spur 4- ,22 8 - 
20Spur5=,62,, ;Spur6= 297.4; Spur 7=359.5 ' 

Fig. 24: (Beispiel 6) 

flj. 24 zeig, das Ergebnis der ReWgung eines GleNKlarcmerproteins: Spur , 
»«t enen MoieKulangewishtes^ ( (B | 0 RAD Ca, Nr ,6,-03,7) FOr 
25 Spur 2 wurden 500 p, BaWeHen direK, vor dar Indutofcn sediment £ 
r Anweisung des Hers*. „ La tf van MuPage Galea ( NO VE ^ 
25) bahandeH und auWrage, Spur 3 zefc, die glelcbe Menge BaWaden ,6 

da nIT ^ ^ SPUre " 4 5 ^ * * <* «— 
der Ni-Nta AgarosesSule nach der Dialvse Hnrrh d.- ■ 

^iaiyse. uurch Remigung fiber Ni-NTA- 
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Agarose (Qiagen) warden hochreine Fraktionen des G.eitWammerproteins 
des Orgamsmus Archaeoglobus fulgidus erhalten (siehe Spuren 4 und 5). 

Fig. 25: (Beispiel 7) 

5 Fig 25 zeigt die Expression und Reinigung der Archaeoglobus fulgidus DNA- 
Polymerase (siehe auch Beispiel 7): 

Spur 1 zeigt einen Moletolaraewichtsstan.lard ((BIO RAD Cat Mr 161-03,7) 

ganaS der Anweisung 2um Lauf „ NuPage ^ 
10 aulgetragen. Spur 3 zeigt die gleiche Merge BaKtenen ,6 Stunden rach der 
Button. Spuren 4 und 5 zeigen j. 8pl der beiden Eluate der Ni-Nta 

£ZT T ^ spur 6 2e ** 8 mi *» 

Grobex^ktes. Spuran 4 und 5 zefcen hocbreine Fraktionen ^ 
Archaeoglobus fulgidus DNA-Polymerase, die durch Reinigung Ober Ni-NTA- 
15 Agarose werden erhalten. 

Fig. 26: (Beispiel 8) 

in Fig. 26 sind die Ergebnisse der Venvendung eines erlindungsgemaCen In 

20 ohne Verwendung einar Gleitklamraer, wohingegen in der Spur 2 das 
Ergebnis einer PCR Reakbon unter Venvendung eines GleitWaranterprateins 



Fig. 27: (Beispiel 9) 

25 



als Y2H P eiTO5 • YMSt - T »^Vbnd--Expen m ents. nierin 

ats Y2H- Expenraent bazeichnet, wobei die Reihe A mil Zellen bestQckt ist 
d.a den laeren pGAD424 Ve«or (Clonted, Palo Ano, USA) tragen, sodaB 
d,e Transkripttons-AWviemngsdoraane expnraiert wird. die Reihe B n* 
30 Zellen besBcK, ist die den PGAD424 VeMo, .ragan, von den, das 
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Sacharomyces cereves/ae-Gen CDC48 als Fusionsprotein mit der 
Transkriptions-Aktivierungsdomane exprimiert wird, die Reihe C mit Zellen 
bestOckt ist, die den pGAD424 Vektor tragen, von dem das G.eitklammergen 
aus Archaeoglobus fulgidus als Fusionsprotein mit der TranskripUons- 
5 Akuvierungsdomane exprimiert wird, die Reihe D nicht mit Zellen bestOckt ist 
und die Reihe E mit Zellen bestuckt ist, die den P GAD424 Vektor tragen von 
dem das Elongationsproteingen aus Archaeoglobus fulgidus als 
Fusionsprotein mit der Transkriptions-Aktivierungsdomane exprimiert wird. 

10 Die Spalte 1 ist mit Zellen bestOckt, die den leeren pGBT9 Vektor (Clontech 
Palo Alto, USA) tragen, sodaB die DNA-Bindedomane exprimiert wird die 
Spalte 2 ist bestuckt mit Zellen, die den pGBT9 Vektor tragen. von dem das 
Saccharomyces cerevisiae^en UFD3 als Fusionsprotein mit der DNA- 
B.ndedomane exprimiert wird, die Spalte 3 ist bestuckt mit Zellen die den 
15 P GBT9-Vektor tragen. von dem das Gleitklammerprotein aus Archaeoglobus 
fulg,dus als Fusionsprotein mit der DNA-Bindedomane exprimiert wird die 
Spalte 4 ist bestOckt mit Zellen. die den pGBT9 Vektor tragen. von dem das 
Kopplungsprotein aus Archaeoglobus fulgidus als Fusionsprotein mit der 
DNA-Bindedomane exprimiert wird und die Spalte 5 ist bestOckt mit Zellen 
20 die den P GBT9 Vektor tragen. von dem das E.ongationsprotein aus 
Archaeoglobus fulgidus als Fusionsprotein mit der DNA-Bindedomane 
exprimiert wird. 



Fig. 28: (Beispiel 10) 

25 In Fig. 28 ist das PCR-Amplifikationsergebnis des humanen Kollagen-Gens 
jewe.ls unter Venvendung des erfindungsgemaften thermostabilen /„ vitro- 
Komplexes und ohne diesen dargestellt. Das erwartete Amplifikat hat in 
be.den Fallen eine GroBe von etwa 1 Kb. Spur 1 zeigt einen 
Molekulargewichtsmarker. Spur 2 zeigt das Ergebnis der Amp.ifikation unter 

30 Venvendung eines erfindungsgemaBen Eiongationsproteins ohne 
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GleiKiammer und Spur 3 zeig, das Ergebnls der 

Ve/wendung des erfindungsgemSBen thermostabilen /„ Complexes. 



Beispiele: 

5 



Die Erfindung wird durch die folgenden Beispiele nSher beschrieben, ist aber 
nicht auf diese beschrankt. 



BeispieM: 

10 



Die DNA w,rd midels dor bekannten Verfahren aus dem ^ 
Ars/raeog/obus f^«„ s (DSM No . 4304) Dfe ^ ^ ^ 

Organismen arfolgla hierbei durch dia DSM (Deutsche Sammlung fur 
M.kraorganismen). Um die entsprecnenden Gene (GleWanrmeriader 1/2 
Glertklammer. ElongatJonsproteine 1/2. koppelnde Untereinhelt) in die 
Expressionsvektoren P Trc99 uad pQE30 zu klonie,en, warden fflr jedes Gen 
Pnmer entwiake*. die den vollslandigen offenen Leserahmen aamt 
Stopcodon umspannen. Nur fflr die Klonierung in pTRC99 ist i„ den Primer- 
Sequanzen ebenfalis das Slaricodon enthaten. Die entepreohenden Primer 
20 zur Klemenung in pQE30 enlbaten die dem Slaricodon unmWeibar fokjenden 
Nukleotide als erste genspezfflsche Sequenzen. Hierbei werden den Primem 
leweils Restrikttonsenden hinzugefflgl. die die gericnlete Klonierung in den 
Expressionsvektor erieichtern. Unler Verwendung van etwa 200 no 
gesamlgenomischer DNA werden ml, den enlsprechenden Annealing- 
25 Temperaluren PCR-Reaktionen gelahren (elwa 35 Zykien) und die da rau s 
resultierenden Produkte gereinigL Nach der Reinigung werten die Produkle 
m,t Restriktionsenzvmen behandelt und Ober ein Agarosegel gereinigt um 
zur Lilian berei. zu stehen. Der Expressiansvektor wird mNtels 
ResWionsenzymen so linearisien. gereinigt und vetfunnt daH e, zur 
30 Ugatron mi, den AmpMraten der Gene des eriindungsgemSSen in «o- 



WO 00/08164 

PCT/DE99/02480 

-57- 

Komplexes aus der obigen PGR bereit ist. Die Ligation wird angesetzt und 
nach Inkubation ein Aliquote in einen der £ coli Stamme INValphaF 
(Invitrogen) odert XL1 blue Oder M15 [prep4] transformiert. Von jedem Gen 
werden mindestens 3 positive Kolonien gepickt, Plasmid-DNA prapariert und 
5 die Inserts auf Vollstandigkeit und Richtigkeit mittels DNA-Sequenzierung 
uberpruft. Korrekte Klone werden ausgesucht und emeut zur Vereinzelung 
auf Agarplatten (Ampidl.in; Ampicillin und Kanamycin) ausgebracht. Kolonien 
werden gepickt und Obemachtkulturen angesetzt. Ein Aliquot (500 ul) der 
Ubernachtkultur wird in eine ein bis funf Liter Kultur von LB (Ampicillin- 80 
10 mg* bzw zusStzlich 25pg/ml Kanamycin fur M15 [prep4]Stamme) gegeben 
D.e Kulturen wachsen bis zu einer ODeeo von 0.8 bei 37°C. Nun wird zur 
Induktion IPTG zugegeben (125 mg/l). Diese Kulturen wachsen nun weitere 
4-21 Stunden. Die Kulturen werden zentrifugiert und ausgehend von dem 
Vektor pQE30 exprimierte rekombinante Proteine gemaft protocol 8 und 11 
15 aus /The QIAexpressionist" (Dritte Auflage, QIAGEN) extrahiert und 
gere.n.gt. In altemativen Reinigungsprotokollen werden die Pellets in einem 
Puffer aufgenommen (Puffer A: 50 mM Tris-HCI pH 7.9, 50 mM Dextrose 1 
mM EDTA). Nach Zentrifugation werden die Ze.len emeut aufgenommen 
jedoch enth.lt Puffer A nun zus.tz.ich Lysozym (4 mg/ml). Nach Inkubation 
20 (15 min.) wird ein gleiches Volumen Puffer B zugegeben (B: 10 mM Tris-HCI 
(PH 7.9), 50 mM KCI, 1 mM EDTA, 1 mM PMSF, 0.5 % Tween 20 0 5 % 
Nonidet P40) und die Lyse zur Inkubation bei 75'C fur eine Stunde gegeben 
Nach Zentrifugation wird der Oberstand entnommen und die 
uberexprimierten Proteine werden mittels (NH 4 ) 2 S0 4 ausgefallt. Die Pellets 
25 werden nach Zentrifugation gesamme.t und die Proteine mit Puffer A 
resuspendiert. Die resuspendierten Proteine werden gegen 
Aufbewahrungspuffer (50 mM Tris-HCI (pH 7.9). 50 mM KCI, 0.1 mM EDTA 
1 mM DTT, 0.5 mM PMSF, 50 % Glycerol) dialysiert und anschlieBend bei 
+4 o Cbis-70 o Cgelagert 
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Um die mm der P rot eine zu testen, werden Reaktionen wie folgt 
zusammengesetzt. Aiiquots der Proteine werden in unterschied.ichen 
Konfigurationen und Molaritaten vereint, Gleitklammerlader 1/2 mit 
Glertklammer, koppelnder Untereinhert und Elongationsprotein 1 oder 
5 Gleitklammeriader 1/2 mit Gleitklammer, mit und ohne koppelnder 
Untereinheit und Elongationsprotein 2, oder Gleitklammer, und 
Elongationsprotein 1 oder 2 und schlieRlich nur Elongationsprotein 1 oder 2- 
als Puffer dient der obige Aufbewahrungspuffer. DNA- 
Polymerisationsaktivitat wird mittels Inkorporation von (methyl- 3 H) TTP in 
10 Tnchlorsaure-unl6sliches Material oder mittels Inkorporation von Digoxigenin- 
dUTP in unmarkierte DNA-Doppe.strangbereiche mit freien intemen 3'- 
Enden gemessen (Ishino, Y., Iwasaki. H., Fukui, H.. Mineno, J., Kato I & 
Schinigawa, H. (1992) Biochimie 74. 131-136). Um die Prozessivrtat zu 
best,mmen, werden die obigen Proteingemische in Primer- 
15 Elongationsexperimenten verwendet. Ein Ml3-Einzelstrangtemplate wird in 
10 mM Tris-HC. (p H 9.4) eingebracht und gemeinsam mit einem Universal- 
pnmer (New England Biolabs) (5'-FITC markiert) erhitzt (92°C) und abgekuhlt 
(Raumtemperatur). VerdQnnungsserien des so generierten Template-Primer- 
Gem.sches werden in einer Reaktion bestehend aus Nukleotiden (etwa 200 
20 M M bis 1 mM), Reaktionspuffer (Endkonzentration: 50 mM KCI, 10 mM Tris- 
HCI (pH 8.3), 1.5-5 mM MgCI 2 , ATP (0 mM - 200 mM) und 
proteinstabilisierenden Agenzien zusammengefuhrt und fQr 10 Minuten bei 
37'C, 52=, 62«, 68", 74', und 78» inkubiert. Ein Aliquot wird zur Analyse auf 
e.nen Sequenzautomaten geladen (z.B. Alf. Pharmacie Biotech). Alternate 
25 kann eine qualitative Analyse der Steigerung der Prozessivitat auch nach 
Maga G., Jonssom Z.O., Stucki M., Spadari S. und HObscher U.( J. Mol Biol 
1999; 285: 259-267, Dual Mode of Interaction of DNA-Polymerase e with' 
Proliferating Cell Nuclear Antigen in Primer Binding and DNA Synthesis) Qber 
den Nachweis einer Stimulation des Einbaus von Nukleotiden in 
30 Doppelstrangbereiche mit freien intemen 3'-Enden unter geeigneten 
Reakhonsbedingungen erfolgen (s. Fig. 23) Die obigen Proteingemische 
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dienen auch dazu Fidelity und Bconukleaseaktivrtat zu messen, wobei die in 
Kohler et al. (Proc. Natl. Acad. Sci. USA 88:7958-7962 (1991) oder Chase et 
al. (J. Biol. Chem., 249:4545-1552 (1972) beschriebenen Verfahren zur 
Anwendung kommen. Ebenso werden die Proteingemische in der PCR 
5 eingesetzt (Fig. 26; Methods in Molecular Biology Vol. 15 Humana Press 
Totowa, New Jersey, 1993, edited by Bruce A. White). 

Beispiel 2: Trimerisierung von PCNA 

In folgenden Experimenten wird gezeigt, daB rekombinantes Archaeoglobus 
10 fulgidus PCNA-Protein (AF 0335) unter nativen Bedingungen als Trimer 
vorl.egt und somit eine fur die Klammerbildung geignete Struktur einnehmen 
kann. 

FQr das in Fig. 20 A abgebildete Experiment wurden 350 pi Ni-NTA Agarose 
Eluat von PCNA (s. Fig. 24) und 150 pi einer rohen DNA-Polymerase 
15 Frakt.on (s. Fig. 25) mit Lagerpuffer ohne Glyzerin (s. Fig. 25) auf 1 ml 
aufgefullt und nach Vorschrift des Herstellers auf einer Superdex 200 HR 
(Pharmacia) FPLC Saule im gleichen Puffer die Proteine nach 
Molekulargewicht aufgetrennt. Es wurden wahrend des gesamten Laufes 
Fraktionen zu je 1 ml gesammelt. Fur das in Fig. 20 B. dargestellte 
20 Experiment wurden gleiche Mengen der gleichen Proteinfraktionen in 
Storagepuffer ohne Glyzerin mit 8 M Harnstoff auf 1 ml aufgefullt 10 
Minuten bei 95<C denaturiert und anschlieBend die Proteine im gleichen 
Puffer wie fur Fig. 20 A dargesteilt nach Molekulargewicht aufgetrennt. Je 8 
pi einzelner Fraktionen wurden anschlieBend auf einem NuPage Bis-Tris Gel 
25 aufgetrennt (NOVEX; s. Fig. 25) und nach Angaben des Herstellers mittels 
eines Blot-Modules (NOVEX) auf Nitrocellulosemembran geblottet Der 
Nachweis von Proteinen mit His-Tag erfolgte nach Angaben der Hersteller 
mittels des RGS His Antibody (QIAGEN) und des DIG Luminiscent Detection 
K.t for Nucleic Acids (Boehringer Mannheim). Fig. 20 A zeigt Proteine mit 
30 His-Tag in den Fraktionen 15 (Spur 1). 17 (Spur 2), 19 (Spur 3), 21 (Spur 4) 
23 (Spur 5), 25 (Spur 6) der ohne Harnstoff durchgefuhrten 
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Chromatographie. Fig. 20B zeigt Proteine mit His-Tag in den Fraktionen 10 
(Spur 1). 11(Spur 2), 12 (Spur 3),13 (Spur 4),14 (Spur 5),15 (Spur 6), 16 
(Spur 7),17 (Spur 8) der in Anwesenheit Harnstoff durchgefuhrten 
denaturierenden Chromatographie. Archaeoglobus fulgidus DNA- 
5 Polymerase (AF0497) hat ein errechnetes Molekulargewicht von Mr = 90 
kDa; Archaeoglobus fulgidus-PCNA (AF0335) hat ein errechnetes 
Molekulargewicht von Mr = 27 kDa. Wenn Archaeoglobus fulgidus-PCM (AF 
335), wie das homologe Protein aus Eukaryonten, als Homotrimer vorliegt 
hat der native Faktor daher ein theoretisches Molekulargewicht von Mr = 81 
10 KDa. Die in Fig. 20A gezeigten Ergebnisse bestatigen diese Annahme. nach 
der natives PCNA ein ahnliches Molekulargewicht aufweist, wie die DNA- 
Polymerase, fur das rekombinante Protein: Beide Proteine eluieren unter 
nativen Bedingungen in den gleichen Fraktionen von der Gelfiltrationssaule 
(F.g 20 A, Spuren 1-3). Das Maximum der PCNA Menge eluiert dabei etwas 
15 spater als das Maximum der DNA-Polymerasemenge und korelliert mit der 
etwas geringeren Grolie des postulierten Trimers (81 kDa gegenOber 90 
KDa). Die in Fig. 20 B gezeigten Daten belegen, daft diese Beobachtung auf 
e.ner Oligomerisierung des PCNA beruht, da unter denaturierenden 
Bedmgungen, die Protein/Protein Interaktionen nicht zulassen. PCNA 
20 deutlich spater von der Saule eluiert als die DNA-Polymerase (Fig. 20 B , 
Spuren 1-7), was dem geringeren Molekulargewicht des Monomers 
entspricht. 

Beispiel 3: Isolierung, Bereitsstellung und Verwendung elnes 
25 Elongationsproteins (Pyococcus horikoshii DNA-Polymerase 
(PH 1947)) zur Ausblldung des erfindungsgemSBen in v/fro-Komplexes. 



is Elongat.onsprotein aus Pyococcus horikoshii (Pyococcus horikoshii- 
JA-Polymerase (PH1947)) wurde in PCR-Reaktionen verwendet und fQhrt 
effizenter Amplifikation eines spezifischen DNA Produktes. 
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1 Spur 4). 2.5 (Spur 5)u„d 5 pi (Spur 6) Pynxoccus bor*os*/ DNA- 
Po ymorase (PH1947; Ronexbak, , Rg . 25) ^ „ ^ ^ 

m 1 Emhen Ta, Polymerase <Spur2) und 1 M , Arohaeoglobus tulgidus-DNA- 

pTrT (A ' ^ <S ' ^ (Spur 3) ««- » «— 1 

PCR-Reakbonen ehgesetzt, Spur , zalg, einan DNA-GriKenmarirer (New 

0^0^!^ " 1 ^ ° NA 

und 100 bp WMfcWwa*,^ Jede ReaMon 

neben dam Enzym 5 ng le mp,a,a DNA (421 bp Raa l-Fmgmen. mi. 
10 Adaptoren in PCR kloniert; (Kaiser C, v. Stein O., Laux G., Hoffmann M 

R^aTrVT 261 - 2% °"""*» * C -er 

Research. IdenMcabon of Targe. Genoa of .he Epstein-Ban Vims Nuclear 

Anbgen 2 by Sub.rac.ive cDNA Cloning and HigMhroughput DWemntia, 
Screening uaing High-density Agarose Gels); je 0,2 mM dATP dTTP dCTP 
15 und dGTP; je 1,5 pM der spezifischen Adaptor-Primer (Kaiser etal nam 
50 mM Kct 2 mM MgCI; . „ mM T „, HC| (pH M Bf Taq . Rea|afonen . » 

7,5 »r Arobaeogfobos fe ,g«„ s und Pyrooocc, to „ te M-Pol y merase- 
Reakbonen) bei einem Gesamholumen von 50 pi pro Reaktion. Die Proben 
durchiiefen 40 Zyklen bestehend eus 30 s bei 95'C; 30 s bei 55'C und 120 s 
20 be arc AnschiieSend wurden 5 p, der Ansato entnommen und auf einem 
U Agarosege, in , x TAE Puffer (40 mM Tris^cela.; 20 mM Natriumacetab 
10 mM EDTA ; pH 7,2) mil lOV/cm aufgetrennt. 

Beispiel 4: Veraendung eines Elongatlonaprotelns 



25 



Die Arobaeogtbbus fufgfdus-DNA-Polymerose AF 0497 kann PCR-Produkte 
ebenao efflzien, vrie Ta q -Po,ymeraae generiemn, Einhei, Tag-Potymerose 
und 1 pi Arobaeog/obu* Mgfdua-DNA-Potymerase AF 0497 Rohexuak. (s 
R0. 25) women zum AkbvMtavergleich indlviduell in standard^ 

ITTZZrz Jede ReaWon enlh,e " neben dem Enzym 

MP18 ssDNA; „ 0,2 mM dATP, dTTP. dCTP und dGTP; je 1.5 pM DNA 



WO 00/08164 



-62^ 



PCT/DE99/02480 



Primer f0| 9 ender Nukleotidsequenz: 

GGATTGACCGTAATGGGATAGGTTACGTT (SEQ ID NO.: 47) bzw 
AGCGGATAACAATTTCACACAGGAAACAG (SEQ ID NO.: 48) in 50 mM 
KCI; 2 mM MgCI 2 ; 10 mM Tris HCI (pH 8,3 fur Taq Reaktionen; pH 7,5 fur 
5 Archaeoglobus fulgidus Polymerase-Reaktionen) bei einem Gesamtvolumen 
von 50pl pro Reaktion. Die Proben durchliefen eine unterschiediiche Anzahl 
von Zyklen bestehend aus 30 s bei 95'C; 30 s bei 59'C und 60 s bei 68°C. 
Nach unterschiedlichen Zyklenzahlen (Z) wurden 5 pi der Ansatze 
entnommen und auf einem 1% Agarosegel in 1 x TAE Puffer (40 mM Tris- 
10 Acetat; 20 mM Natriumacetat; 10 mM EDTA ; pH 7,2) mil 10V/cm aufgetrennt 
(Siehe Fig. 22). 

Beispiel 5: Bereitsstellung und Verwendung eines erfindungsgemaOen 
thermostabilen in Wfro-Komplexes: 

15 

In einem Endvolumen von 50 pi waren unter anderem folgende 
Komponenten eines erfindungsgemallen in wrro-Komplexes enthaften: 10 
mM Tris/HCI pH 7,5; 50 mM KCI; 2 mM MgCI 2 ; 10 pg BSA (kann auch 
weggelassen werden); 0,5 mM Digoxigenin-dUTP (DIG-dUTP, Boehringer 

20 Mannheim); 40 nM ; 0,5pg Poly dA/40 nM OligodT (20mer) Hybrid. Probe 1 
ohne Elongationsprotein. Proben 2-12 enthielten aufterdem je 3 M I einer 
1:1000 VerdQnnung einer Fraktion von rekombinanter Archaeoglobus 
fo/g/cfus-DNA-Polymerase (Elongationsprotein). Proben 3-7 sowie 8-12 
aufterdem 0,5; 1; 2; 4 und 8 pi einer Fraktion von rekombinantem 

25 Gleitklammerprotein aus Archaeoglobus fulgidus. 

Die Proben wurden 30 Minuten bei 68'C inkubiert und Nukleinsauren 
anschliefiend durch Prazipitation mit 3 Volumenteilen Ethanol / 3 M 
Natriumacetat P H 5.2 (30/1). Gefallt. Das Prazipitat wurde in 20 pi 100 mM 
30 Tris-HCI (pH 7,9) resuspendiert und je 10pl in einzelne Kavitaten einer 96- 
Well Silent Screen plate with Nylon 66 Biodyne B 0.45pm pore (Nalge Nunc) 
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aufgetropfl und die Nukleinsauren 10 Minuten bei 70°C auf der Membran 
fixiert. Die Detection von inkorporiertem Digoxigenin-dUTP (Boehringer 
Mannheim) erfolgte mittels des DIG Luminiscent Detection Kit for Nucleic 
Acids (Boehringer Mannheim). Zum Nachweis der Chemilumineszenz wurde 
5 auf die Membran abschlieBend fur 30 s ein R6ntgenfilm aufgelegt. PCNA 
stimuliert die Einbindung von DIG-dUTP durch die DNA-Polymerase deutlich 
(vgl. Spuren 3-7 mit Spur 2). Die verwendete PCNA- Fraktion weist keine 
endogene Polymeraseaktivitat auf (Spuren 8-12). 

10 Beispiel 6: Amplifikation; Klonierung, Expression und Reinigung eines 
Gleitklammerproteins aus Archaeoglobus fulgidus: 

Nach Amplifikation des erfindungsgemalien Gleitklammerprotein Gens aus 
Archaeglobus fulgidus wurde das Gen in die Expressionsvektoren P Trc99 
und pQE30 kloniert. Die Expression, Reinigung und gelelektrophoretische 
15 Auftrennung von Archaeoglobus fulgidus-Gleitklammerprotein (PCNA (AF 
0335)) erfolgte, wie fur das Elonagationsprotein (die DNA-Polymerase AF 
0497) in Fig. 25 dargestellt. 

Beispiel 7: Bereitstellung eines Elongationsproteins 

20 Expression und Reinigung der Archaeoglobus fu/g/dus-DNA-Polymerase: 
PQE 30 Plasmid-DNA (QIAGEN) mit in korrektem Leseraster inseriertem 
Gen fQr das Elongationsprotein, die Archaeoglobus fulgidus DNA- 
Polymerase AF 0497, wurde nach Anleitung aus The QIAexpressionist 
(dritte Auflage; QIAGEN)" in kompetente E.coli M15 [prep 4] transformiert. 

25 Clbertragung auf 1 L Kulturmedium und induzierte Proteinexpression erfolgte 
ebenfalls nach den dort vorgegebenen Schemata. Nach 16 Stunden 
Induktionszeit wurden die Bakterien 10 Minuten bei 5000 g sedimentiert. 
Zum Emalt hochreiner Fraktionen wurde gemali The QIAexpressionist (dritte 
Auflage; QIAGEN; protocol 8. protocol 11) verfahren. Lediglich die Elution 

30 der gebundenen Proteine erfolgte mit 2 x 2 ml Elutionspuffer und nicht wie 
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dort beschrieben mft4 x 0,5 ml Elutionspuffer. Zum Erhalt von Rohextrakten 
rekombinanter Proteine wurden die Bakteriensedimente alternate mit 100 ml 
Puffer A (50 mM Tris-HCI pH 7.9; 50 mM Glukose;1 mM EDTA) gewaschen 
und nach erneuter Zentrifugation in 50 ml Puffer A mit 4mg/ml Lysozym 
5 resuspendiert. Nach 15 Minuten bei Raumtemperatur erfolgte die Zugabe 
von 50 ml Lysepuffer (10 mM Tris-HCI pH 7.9; 50 mM KCI; 1 mM EDTA- 
0,5% Tween 20; 0,5% IGPAL) und E. coli-Proteine wurden durch 60-minOtige 
Inkubation bei 75X im Wasserbad denaturiert. Nach anschlieBender 
Zentrifugation fur 15 Minuten bei 27000 g wurde der Oberstand durch 
tOlangsame unter permanentem RQhren erfolgte Zugabe von 40 mg 
kristallinem Ammoniumsulfat pro ml Extrakt prazipitiert. PrSzipitierte Proteine 
wurden 10 Minuten bei 27000 g sedimentiert und das Sediment in 20 ml 
Puffer A resuspendiert. Sowohl diese Rohextrakte als auch die 
Elutionsfraktionen aus der Ni NTA-Agarose wurden je 2-mal 8 Stunden 
15 gegen mindestens je 50 Volumenteile Lagerpuffer (Puffer (10 mM Tris-HCI 
PH 7.9; 50 mM KCI; 1 mM EDTA; 50% Glyzerin; 1 m>M Dithiothreitol; 0,5 
mM Phenylmethylsulfonylfluorid) dialysiert und bei -20°C aufbewahrt. Zur 
Analyse der Proteinzusammensetzung der erhaltenen Fraktionen wurden 
Teile davon nach Anweisungen des Herstellers auf NuPAge™ 10% Bis-Tris 
20 Gelen (NOVEX) elektrophoretisch aufgetrennt und die enthaltenen Proteine 
mit Coomassie brilliant blue angefarbt. Spur 1 zeigt einen 
Molekulargewichtsstandard ((BIO RAD Cat Nr 161-0317). Fur Spur 2 wurden 
500ul Bakterien direkt vor der Induktion sedimentiert, gemaB der Anweisung 
zum Lauf von NuPage Gelen behandelt und aufgetragen. Spur 3 zeigt die 
25 gleiche Menge Bakterien 16 Stunden nach der Elution. Spuren 4 und 5 
zeigen je 8ul der beiden Eluate der Ni-Nta-Agarosesaule nach der Dialyse. 
Spur 6 zeigt 8 ml eines dialysierten Grobextraktes. Durch Reinigung uber Ni- 
NTA-Agarose werden hochreine Fraktionen der Archaeoglobus fulgidus 
DNA-Polymerase erhalten (Spuren 4 und 5). Aber bereits im Grobextrakt 
30 stellt dieses Enzym das dominierende Polypeptid dar. 
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Beispfel 8: Verwendung eines erfindungsgemaBen in vitro Komplexes 
inderPCR 



Der E.nsatz von Archeoglobus fulgidus PCNA (AF 0335) in PGR Reaktionen 
5 m.t Archeoglobus fulgidus DNA-Polymerase (AF 0497) fuhrt zu einer 
effizienteren Amplifikation eines spezifischen DNA-Produkts im Vergleich zu 
einer PCR-Reaktion ohne PCNA.. Die Auswertung der amplifizierten DNA- 
Mengen laut AIDA (Advanced Image Data Analyzer, Software Version AIDA 
2.1, F.rma Raytest) zeigt einen Hintergrund von 94, eine Wert von 104 9 fur 
10 Spur 1 und einen Wert von 228,4 fur Spur 2. Zieht man von den Werten aus 
den Spuren 1 und 2, den Hindergrund ab, folgt daraus eine 12 3-fache 
prozessive Stimulation durch PCNA in der Reaktion dessen Ergebnis in Spur 
2 gezeigt ist. 

15 0,3 M | Archeoglobus fo/g/dus-DNA-Polymerase (7.5 pg/ U | 
Proteinkonzentration von AF497; Rohextrakt siehe Fig. 25) wurden zur 
Analyse einer Stimulation der PCR-Aktivitat durch Archeoglobus fulgidus- 
PCNA (NINTA Eluat; Fig.24) mit 0 pi und 0,01 pi individuell in PCR 
Reaktionen eingesetzt. Jede Reaktion enthielt neben dem Enzym und 0 05 ul 
20 (2.8 pg) des Gleitklammerproteins von Archaeglobus fulgidus (homolog zu 
prohferating-cell-nuclear antigen. PCNA) eines mittels PCR amplifizierten und 
n,cht aufgereinigten PCNA-Gen-Fragments (PCR Reaktion zur spezifischen 
Amplifikation des PCNA-Fragments: 0,5 p. Archeoglobus fulgidus 
Polymerase; je 0.2 mM dATP, dTTP , dCTP und dGTP; je 1,5 pM der 
25 spezifischen Primer (5 -ACG CGC GGA TCC ATA GAC GTC ATA ATG ACC 
GG-3- (SEQ ID No, 49); 5'-TAC GGG GTA CCC GAG CCA AAA TTG GGT 
AAA G-3" (SEQ ID No,50); 50 mM KCI; 2 mM MgCI 2 ; 10 mM Tris-HC. (pH 
7.5) sowie 50 ng eines P QE30 Plasmids, das die kodierenden Sequenzen 
von Archaeoglobus fulgidus PCNA in die BamHI- und Kpn I- 
30 Restriktionsstellen insertiert tragt, bei einem GesamtvCumen von 50 pi pro 
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Reaktion und bei einer Zyklenzahl von 40 bestehend aus 30 s bei 95°C; 30 s 
bei 61 °C; 240 s bei 68°C); je 0,2 mM dATP, dTTP, dCTP und dGTP; je 1,5 
uM der spezifischen Primer 

(5-ACG CGC GGA TCC ATA GAC GTC ATA ATG ACC GG-3' (SEQ ID No.: 
5 51); und 5-TAC GGG GTA CCC GAG CCA AAA TTG GGT AAA G-3' (SEQ 
ID No.: 52); 50 mM KCI; 2 mM MgCI 2 ; 10 mM Tris HCI pH 7,5 bei einem 
Gesamtvolumen von 50 pi pro Reaktion. Die Proben durchliefen 40 Zyklen 
bestehend aus 30s bei 95°C; 120s bei 61X; 240s bei 68X. AnschlieBend 
wurden 5 pi der Ansatze entnommen und auf ein 1 % Agarosegel in 1 x TAE 
10 Puffer (40 mM Tris-Acetat; 20 mM Natriumacetat; 10 mM EDTA; pH 7,2) mit 
10 V/cm aufgetrennt. 



Beispiel 9: Y2H-Experimente: 

Interaktionen von Proteinen des erfindungsgemafien Komplexes aus 
15 Archaeoglobus fulgidus wurden mit dem Y2H-System gezeigt. Die 
kodierenden Bereiche von Genen aus Archaeoglobus fulgidus, deren 
Genprodukte im erfindungsgemaBen thermostabilen in wto-Komplex 
verwendeten werden, wurden mittels PCR amplifiziert, in die Vektoren 
PGBT9 (vertikale Spalten der Fig. 27) und pGAD424 (horizontale Reihen der 

20 Fig. 27) kloniert und durch gap-repair in Hefe PJ69-4a (for pGAD424) und 
PJ69-4alpha (fur pGBT9) als Hybridproteine zur Expression gebracht. 
Ebenso wurde eine positive Kontrolle mittels PCR amplifiziert, in die 
Vektoren pGBT9 (siehe auch vertikale Spalten der Fig. 27) und pGAD424 
(siehe auch horizontale Reihen der Fig. 27) kloniert und durch gap-repair in 

25 den Hefestamm PJ69-4a (fur pGAD424) und PJ69-4alpha (fur pGBT9) als 
Hybridproteine zur Expression gebracht. Diploide Zellen. die beide Vektoren 
enthalten, wurden durch Paarung entsprechend dem gezeigten Raster in Fig. 
27 erzeugt Die Expression von drei unabhangigen Reportern (HIS3, ADE2 
und MEL1) wurde gemessen. Gezeigt ist in Fig. 27 das Wachstum auf 

30 Medium ohne Histidin und Adenin. In diesem Experiment wachsen jene 
Zellen, die beide Vektoren tragen und in dessen zudem die 
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Expressionsprodukte dieser beiden Vektoren einander binden. In Folge der 
Bindung der Expressionsprodukte wird Transkription der Reportergene 
inltiiert, so daB die Histidin- und Adenin-Auxotrophie aufgehoben wird und 
diese Zellen in der Lage sind in besagtem Medium zu wachsen. 



Alle hier positiven Klone waren auch posttiv bezOglich der Expression des 
MEU-Gens. Die Handhabung des yeast two-hybrid (Y2H)systems erfolgte 
gemaB der Anleitung der Firma Clontech (yeast protocols handbook, 
PT3024-1). Fig. 27 zeigt eine Bindung zwischen den Proteinen der 
10 Positivkontrolle, dem Elongationsprotein und dem Gleitklammerprotein, dem 
Gleitklammerprotein und dem Gleitklammerprotein und dem 
Kopplungsprotein und dem Gleitklammerprotein. 

Beispiel 10: Verwendung eines erfindungsgemaBen thermostabilen in 
15 vitro-Komplexes: 



Der erfindungsgemalie thermostabile in wto-Komplex laBt sich sehr gut bei 
der Amplifikation von genomischen DNA Fragmenten einsetzen. Hierbei 
kommt es auch bei Verwendung von geringen Mengen eines Templates oder 

20 eines Elongationsproteins zu effizienter Amplifikation. In Beispiel 10 wurde 
eine Abschnitt des humanen Kollagen-Gens amplifiziert. einmal unter 
Verwendung des erfindungsgemaBen thermostabilen in vitro-Komplexes und 
einmal unter Verwendung eines Elongatiosnproteins alleine. In einem 
Gesamtvolumen von 50 pi wurden 0,5 pi NukJeotidmix (25 mM 

25 Ausgangsl5sung beinhaltend jedes Nukleotid A, C, G und T), 0,2 pi jedes 
Primers (100 pmol/pl Ausgangslosung "Collagen Forward" 5-TAA AGG GTC 
ACC GTG GCT TC-3' (SEQ ID NO, 53), 100 pmol/pl Ausgangslosung 
"Collagen Reverse" 5'- CGA ACC ACA TTG GCA TCA TC-3' SEQ ID NO.: 
54), 0,8 pi DNA (200 ng/pl human genomic DNA von Boehringer Mannheim) 
30 5 pi 10 x PGR Puffer (pH 7.5) (100mM Tris-HCI pH7.5. 500 mM KCI.15 mM 
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MM) .V a^*W* (AF1722, 7.5 pg/pl Wfc^ und , 

0ttta -~ <AF 0335, Pre.elnkonzen.raton 0.3 pg,p„ eingeseta 
und „ dem fo|genden ZyMus un 

- .be, 95X und dann 30-mal. 30 s M 95 - c , 30 , M " 
5 <UM 6 min. aei 58-C. Die Ffc. 28 zeig, deutlicn den Vortei, der 
Venvendung dee erfindungsgemaBen thermostabilen In *o*om pl exe S . 

Die in dervorstehenden Beschreibung so»e in den AnsprOchen onenbarten 
Merkmaie der Erfindung k(i „ ren ^ ein2eln a|s auch fc 

10 MM. Ilr die Ve™«ch u „g der Erfindung in ihren verscbiedenen 
Ausfuhrungsformen wesentlich sein. 
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PatentansprQche 

1 Thermostabiler in wfro-Komplex zur Template-abhangigen Elongation 
von Nukleinsauren, umfassend ein thermostabiles 
Gleitklammerprotein und ein thermostabiles Elongationsprotein. 

2. Thermostabiler /„ Complex nach Anspruch 1, dadurch 
gekennzeichnet, dalJ das Gleitklammerprotein mit einem 
Elongationsprotein verbunden ist. 

3. Thermostabiler in wfro-Komplex nach Anspruch 1, dadurch 
gekennzeichnet, daB ein Gleitkammerprotein mit einem 
Elongationsprotein direkt verbunden ist. 



I. 



Thermostabiler//) wrro-Komplex nach Anspruch 1 oder2, 
dadurch gekennzeichnet, 

dass das Gleitklammerprotein und das Elongationsprotein Qber ein 
Kopplungsprotein verbunden sind. 

Thermostabiler in wto-Komplex nach einem der Anspriiche 1 bis 4, 
dadurch gekennzeichnet, 

dass das Gleitklammerprotein und/oder das Elongationsprotein aus 
Archaebakterien stammen. 

Thermostabiler in vtfro-Komplex nach einem der Anspriiche 1 bis 5, 
dadurch gekennzeichnet, 
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dass das Gleitklammerprotein eine ringformige Stryktur aufweist, 
welche die Template-Nukleinsaurestrange ganz oder teilweise 
umschlieBt. 



5 7. Thermostabiler in vffro-Komplex nach einem der Anspriiche 1 bis 6, 
dadurch gekennzeichnet, 

dass das Gleitklammerprotein eine oder beide der folgenden 
Aminosaurekonsensussequenzen umfalit: 
SEQ ID No.:39 

10 [GAVLIMPFW]-D-X-X-X-[GAVLIMPFVV]-X-X-[GAVLIMPFVV]-X- 

[GAVLIMPFW]-X-[GAVLIMPFW]-X-X-X-X-F-X-X-Y-X-X-D 
und / oder 

SEQ ID No.: 40 

[GAVLIMPFW].X(3)-L-A-P-[KRHDE]-[GAVLIMPFWl-E. 



15 
8. 



20 



25 



30 



Thermostabiler in wfro-Komplex nach einem der Anspriiche 1 bis 7, 
dadurch gekennzeichnet, 

dass das Gleitklammerprotein zu der menschlichen (Eukaryonten) 
PCNA Aminosauresequenz (SEQ ID NO. 11) auf einer Lange von 
mindestens 100 Aminosauren bei einem Sequenzalignment eine 
mindestens 20 %ige Sequenzidentitat aufweist und/oder das 
Gleitklammerprotein zu der bakterielle li-clamp Sequenz aus Ecoli 
(Eubakteria) (SEQ ID NO. 35) auf einer Lange von mindestens 100 
Aminosauren bei einem Sequenzalignment eine mindestens 20 %ige 
Sequenzidentitat aufweist und/oder das Gleitklammerprotein zu der 
Aminosauresequenz des PCNA-Homologen aus Archaeoglobus 
fulgidus (SEQ ID NO. 12) auf einer Lange von mindestens 100 
Aminosauren bei einem Sequenzalignment eine mindestens 20 %ige 
Sequenzidentitat aufweist. 
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9. Thermostabiler Komplex nach einem der vorhergehenden Anspruche, 
dadurch gekennzeichnet, 

dass das G.eitklammerprotein mit einem aus einem Alignment aus Fig 
12 generierten Hidden Markow Modell einen Score von mindestens 20 
erg,bt und/oder wobei das Gieitkiammerprotein mit einem aus einem 
Alrgnment aus Fig. 13 generierten Hidden Markow Modell einen Score 
von mindestens 25 ergibt. 

10. Thermostabiler in Complex nach einem der vorhergehenden 
Ansproche, dadurch gekennzeichnet. dalj das G.eitklammerprotein ein 
Gieitkiammerprotein ist, das aus einem Organismus stammt. der 
ausgewahlt ist aus der Gruppe, die Archaeogtobus fuigidus, 
Methanols jannaschii, Pyococcus horikoschii, Methanobacterium 
thermoautotrophicus, Aquifex aeolicus und Carboxydothermus 
1 5 hydrogenofhormans umfafit. 

11. Thermostabiler in Complex nach einem der vorhergehenden 
Anspriiche, 

dadurch gekennzeichnet, 

dass das Gieitkiammerprotein ausgewahlt ist aus der Gruppe die 
AF0335 aus Archaeoglobus fulgidus, MJ0247 aus Methanococcus 
jannaschii, PHLA008 aus Pyococcus horikoschii. MTH1312 aus 
Methanobacterium thermoautotrophicus sowie AE000761_7 aus 
Aquifex aeolicus umfaBt. 

12. Thermostabiler in vtfro-Komplex nach einem der vorhergehenden 
Ansprtlche, 

dadurch gekennzeichnet, 
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dass das Elongationsprotein eine 5'-3'-Polymeraseaktivitat und/oder 
eine Reverse-Transkriptaseaktivitat aufweist. 

1 3. Thermostabiler in wfro-Komplex nach Anspruch 12, 
5 dadurch gekennzeichnet, 

dass das Elongationsprotein mindestens eine der folgenden 
Konsensussequenzen umfaBt und an nicht mehr als vier Positionen 
von dieser Sequenz abweicht: 
SEQ ID NO. 44: 

10 D-[GAVLIMPFW]-[GAVLIMPFW]-X-X-Y-N-X-X-X-F-D-X-P-Y- 
[GAVKUNOFWJ-X-X-R-A 
SEQ ID NO. 45 

A-[GAVLIMPFW]-R-T-A-[FAVLIMPFW]-A-[GAVLIMPFW]-[GAVLIMP 

E-G-[GAVLIMPFW]-V-X-A-P-[GAVLIMPFW]-E-G-I-A-X-V-[KRHDE1-I 
15 SEQ ID NO. 46 

[GAVLIMPF^-P-V-G-[GAVLIMPFWJ-G-R-G-S-X-[GAVLIMPFW]-G-S- 

[GAVKUNOFW]-V-A-X-A-[GAVLIMPF\A0XI-T-D-[GAVKUNOFVVJ-D-P- 
[GAVLIMPFVv>X-X-X-[GA^ 

S-M-P-D. 

20 

14. Thermostabiler in wfro-Komplex nach Anspruch 12, 

dadurch gekennzeichnet, 
dass das Elongationsprotein eine zu der menschlichen (Eukaryonten) 
Aminosauresequenz (SEQ ID NO. 22) auf einer Lange von mindestens 200 

25 Aminosauren bei einem Sequenzalignment eine mindestens 20 o/ oige 
Sequenzidentitat aufweist und/oder zur archaebakteriellen 
Aminosauresequenz (SEQ ID NO. 27) auf einer Lange von mindestens 400 
Aminosauren bei einem Sequenzalignment eine mindestens 25 %ige 
Sequenzidentitat aufweist und/oder zur eubakteriellen Aminosauresequenz 

30 (SEQ ID NO. 37) auf einer Lange von mindestens 300 Aminosauren bei 



WO 00/08164 



-73- 



PCT/DE99/02480 

I 



10 



einem Sequenzalignment eine mindestens 25 o /oige SequenzidentfBit 
aufweist. 

15. Thermostabiler//, wto-Komplex nach Anspruch 12, 
5 dadurch gekennzeichnet, 

dass das Elongationsprotein mit einem aus einem Alignment aus Fig 
17 generierten Hidden Markow Model! einen Score von mindestens 20 
ergibt und/oder das Elongationsprotein mit einem aus einem 
Ahgnment aus Fig. 1 8 generierten Hidden Markow Modell einen Score 
von mindestens 35 ergibt und/oder das Elongationsprotein mit einem 
aus e.nem Alignment aus Abbildung 19 generierten Hidden Markow 
Modell einen Score von mindestens 20 ergibt. 

16. Thermostabiler in wf/o-Komp.ex nach einem der vorhergehenden 
15 Ansprtiche, dadurch gekennzeichnet, da B das Elongationsprotein ein 
Elongationsprotein ist. das aus einem Organismus stammt, der aus der 
Gruppe ausgewahlt ist, die Archaeglobus fulgidus, Methanococcus 
jannaschii, Pyrococcus nonKoschii, Methanobactenum 
thermoautotrophicus, Pyrococcus funosus und Carboxydothermus 
M hydrogenoformans umfalSt. 

17. Thermostabiler in wfro-Komplex nach einem der vorhergehenden 
Ansprtiche, 

dadurch gekennzeichnet, 

dass das Elongationsprotein ausgewahlt ist aus der Gruppe die 
AF0497 Oder AF1722 aus Archaoglobus fulgidus, MJ0885 'oder 
MJ1630 aus Methanococcus jannaschii, PHBT047 oder PHBN021 aus 
Pyrococcus horikoschii, MTH1208 oder MTH1536 aus 
Methanobactenum thermoautotrophicus sowie PFUORF3 aus 
30 Pyrococcus furiosus umfalSt. 
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18. Thermostabiler in Complex nach einem der vorhergehenden 
Ansprtlche, 

dadurch gekennzeichnet, 

5 dass das Kopplungsprotein die folgehde Konsensussequenz 
be.nhaltet und an nicht mehr als vier Positionen von dieser Sequenz 
abweicht 
(SEQ. ID N0.43.) 
^HGAVUMPRA^OC-^ 

10 [GAVLIMP^X-[GAVLIMPFWJ-A.G-[DN].[GAVLIMP 
PS]. 



19. Thermostabiler in Complex nach einem der vorhergehenden 
Anspruche, 

15 dadurch gekennzeichnet, 

dass das Kopplungsprotein zu der menschlichen (Eukaryonten) 
Aminosauresequenz (SEQ ID NO: 16 ) auf einer Lange von 
mindestens 150 Aminosauren bei einem Sequenzalignment eine 
mindestens 18 %ige Sequenzidentitat auftveist. 



20 



20. Thermostabiler in Complex nach einem der vorhergehenden 
Anspruche, 

dadurch gekennzeichnet, 

dass das Kopplungsprotein mil einem aus einem Alignment aus 
25 Abbildung 16 generierten Hidden Markow Modell einen Score von 
mindestens 10 ergibt. 



21. Thermostabiler in Complex nach einem der vorhergehenden 
AnsprOche, dadurch gekennzeichnet, daB das Kopplungsprotein ein 
Kopplungsprotein ist, das aus einem Organismus stammt, der aus der 
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Gruppe ausgewahlt ist, die Archaeglobus fulgidus, Methanococcus 
jannaschii, Pyococcus horikoschii. Methanobacterium 
thermoautotnophicus, Pyrococcus furiosus und Carboxydothermus 
hydrogenophormans umfaBt. 

5 

22. Thermostabiler in wfro-Komplex nach einem der vorhergehenden 
Anspruche, 

dadurch gekennzeichnet, 

dass das Kopplungsprotein augewahlt ist aus der Gruppe, die AF1790 
10 aus Archaeoglobus fulgidus. MJ0702 aus Methanococcus jannaschii, 
PHBN023 aus Pyrococcus horikoschii, MTH1405 aus 
Methanobacterium thermoautothrophicum sowie PFUORF2 aus 
Pyrococcus umfaBt. 

15 23. Thermostabiler in Complex nach einem der vorhergehenden 
Anspruche, 

dadurch gekennzeichnet, 

dass der Komplex mit einem Protein assoziiert ist, welches als 
Gleitklammerlader fungiert. 

20 

24. Thermostabiler Komplex nach einem der vorhergehenden Anspruche, 
dadurch gekennzeichnet, 

dass der Komplex mit ATP oder einem anderen Kofaktor assoziiert 
voriiegt. 

25 

25. Rekombinante DNA-Sequenz, 
dadurch gekennzeichnet, 

dass sie fur einen thermostabilen in wfrc-Komplex gemaB einem der 
Anspruche 1 bis 24. 

30 
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26. Vektor, 
dadurch gekennzeichnet, 

dass er eine fur ein Gleitklammerprotein und ein Kopplungsprotein 
und/oder ein Elongationsprotein codierende. rekombinante DNA- 
Sequenz enthalt. 

27. Vektor nach Anspruch 26, 
dadurch gekennzeichnet, 

dass er zusatzlich mindestens eine weitere DNA-Sequenz mit 
mindestens einer geeigneten Restriktionsschnittstelle zur Insertion 
werterer DNA-Sequenzen in einer solchen Anordnung enthalt, dass 
s.ch e.n Fusionsprotein aus Gleitklammerprotein und dem 
Expressionsprodukt der weiteren DNA-Sequenzen ergibt. 

15 28. Vektor nach Anspruch 26 oder 27, 
dadurch gekennzeichnet, 

dass er geeignete, die Expression der DNA-Sequenz(en) steuemde 
Promotor- und/oder Operatorbereiche enthalt. 

20 29. Vektor nach Anspruch 28, 
dadurch gekennzeichnet, 

dass er mehrere Promotor- und/oder Operatorbereiche zur 
getrennten Expression mehrerer DNA-Sequenzen enthalt. 

25 30. Vektor nach einem der AnsprOche 26 bis 29, 
dadurch gekennzeichnet, 

dass er reprimier- und/oder induzierbare Promotor- und/oder 
Operatorbereiche enthalt. 
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31 . Vektor nach einem der Anspriiche 26 bis 30, 
dadurch gekennzeichnet, 

dass er eine DNA-Sequenz nach Anspruch 25 enthalt. 

5 32. Wirtszelle, 

dadurch gekennzeichnet, 

dass * mi, einem oder mehreren Vektoren nach einem 
A^Pmche 26 bis 3, transformer, isl. 

10 33. Vertahren „ Hersteiiung eines thermostab«en ,„ ^ omplexes 
gemas einem der Ansprtlche 1 bis 24, 
dadurch gekennzeichnet, 

dass eine entsprechende rekombinante DNA-Sequenz gemaa 

« ZZt 2 LT e,nen '* ^ der VeM ™ ^ « 

M» hew,*, und dfese aus dem KMm ^ m 

Zetiautschittss ieoiiert um) gegebenentaiis noch mi, wekeren 
Komplexbestandteilan koppell. 

20 M ' ITd" r' 6 *'^* 6 " Eto " Sa «°" ™" Nukieinsaurcn 
w^e, d,e Nukie.nsaure denaturjert mS ' 

e,nem Pnmer un,er Hybrt^ngsbedingungen versehen wird wobei 
der Pnmer hinreichend komp,emen B , „ einem .ankie.nden BeC 
« ~- Nnkieinsaureeeguenz des Tem pte ,e. Stra „g S C 

Hnn! eme ; ?°' ymeraSe A "~ »" N **en eine Pdme, 
Elongation erfolgt, 

dadurch gekennzeichnet, 

dass ais Poiymerase ein mermostabiier/n ^rc-Kompie* gemaS einem 
der Ansprtiche Ibis 24 verwendet wird. 
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35. Verfahren nach Anspruch 34, 
dadurch gekennzeichnet, 

dass man zur Amplifikation von DNA-Sequenzen zwei die gewiinschte 
Nukleinsauresequenz flankierende Primer und Deoxynukleotide 
und/oder Derivate davon und/oder Ribonukleotide und/oder Derivate 
davon verwendet. 



36. Verfahren nach Anspruch 35, 
10 dadurch gekennzeichnet, 

dass man eine Polymerase-Ketten-Reaktion durchfuhrt. 

37. Verfahren nach Anspruch 34, 
dadurch gekennzeichnet, 

dass man zur Reversen-Transkription von RNA in DNA einen 
thermostabilen in wtarKomplex gemaB einem der Anspriiche 1 bis 24 

einsetzt, dessen Elongationsprotein Reverse-Transkriptase-Aktivitat 
aufweist. 



15 



20 38. Verfahren nach einem der Anspriiche 34 bis 37 
dadurch gekennzeichnet, 
dass man zur Sequenzierung von Nukleinsauren ausgehend von einem 
Primer, der zu einem der zu sequenzierenden Nukleinsaure benachbarten 
Bereich komplementar ist, eine Template-abhangige Elongation bzw. 

25 Reverse-Transkription unter Verwendung von Deoxynukleotiden und 
Dideoxynukleotiden Oder deren jeweiligen Derivaten gemaB der Methode 
von Sanger durchfuhrt. 
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31. Verfahren nach einem der Anspriiche 34 bis 38, 
dadurch gekennzeichnet, 

dass man bei der Elongation der Nukleinsauren Markierungen einfOgt. 
5 40. Verfahren nach Anspruch 39, 

dadurch gekennzeichnet, 

dass man martdene Pnmer und/adar ma ^ 

ZT, "** m "** D ^«eo 0 de 

und/oder deren Denvate und/adar markierte RibonukJeoude und/oder 
10 deren Denvate einsetzt. 

41. Verfahren zur Markierung van Nukieinsauren durch Erzeugung 
einzelner BrOche in Pheaphodiestereindungen dar NuWeinsaurekette 
und Ersatz ainaa Nukleatids an dan Bruchstellen durch ain markiertes 
15 NuWeotidmitHilfeeiner Polymerase, 
dadurch gekennzeichnet, 

dass als Polymerase ain mermostabiter in ttfre-Komplex nach ainam 
der Ansprtlche 1 bis 24 eingesetzt wird. 



20 42. 



Reagenzien-Kn zur Elongation und/adar Amplfctian und/oder 
reversen Trenskdptian und/oder Sequenzierung u „d/adar Markierung 
von Nukieinsauren. emhaltend in einem adar mahreren gatrennten 
Behaltern 

a) ainan memtostabilen /„ vSre-Kompiex nach einem der 
25 Ansprtlche Ibis 24 Oder 

b) einen thermcatabilen In implex nach einem der 
AnsprtJche 1 bis 24 und separe, davan ain P^mereseaWMa. 
aufweisendes Elongationsprotein, 
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sowie gegebenenfalls Primer, Puffersubstanzen, Nukleotlde ATP 
e.nen oder mehrere andere Kofaktoren und/oder Pyrophosphatase. ' ' 

43. Kit nach Anspruch 42, 
5 dadurch gekennzeichnet, 

dass erzur Ampliation von Nukleinsauren neben den Komponenten 
a) oder b), welche 5'-3'-Polymeraseaktivitat aufweisen 
Deoxynukleotide und/oder Derivate davon enthalt. 

10 44. Kit nach Anspruch 42, 

dadurch gekennzeichnet, 

dass er zur reversen Transkription die Komponenten a) oder b) 
enthalt, welche reverse Transkriptase-Aktivrtat aufweisen, sowie 
Deoxynukleotide und/oder Derivate davon. 



15 



45. Kit nach einem der AnsprGche 42 bis 44, 
dadurch gekennzeichnet, 

dass er zur Sequenzierung neben Deoxynukleotiden oder 
Ribonukleotiden und/oder deren Derivaten. Dideoxynukleotide 
*v und/oder deren Derivate enthalt. 

46. Kit nach einem der Anspriiche 42 bis 45, 
dadurch gekennzeichnet, 

dass er Primer und/oder Deoxynukleotide und/oder Dideoxynukleotide 
in markierter Form enthalt. 
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Fig. 2: 



Komponenten des 

Elongarions- 

holoenzymes 


Eubakteria 
Escherichia coli 


Aquifex Aeoiicus 
(%IdentitSt | 
Alignmentlange)' 


Gleitklarmner 


DP3B ECOLI 
fSEQ ID NO:35] 


AASEQ93 
(28% | 370) 
[SEQIDNO:36| 


Elongatioasprotein 


DP3A ECOLI 
[SEQ ID NO:37) 


AASEQ50 
(37% |1154) 
[SEQ ID NO:381 
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Gleitklammer Region 1 : 



PCNA_HUMAN 
PCNA METJA 



MDS SHVSLVQLTLRSEGFDTYRCD 
MDPSHVALVSLEIPRLAFEEYEAD 
LDRSHITYVHLELKAELFDEYVCD 
MDPSRWLIDLNLPSSIFSKYEVD 
VDPANVAMVI VDI PKDSFEVYNID 



MTH1312 
PHLA008 
AF0335 



Konsensus : $DXXX$XX$X$X$XXXXFXXYXXD 

Pattern : [GAVLIMPFW] -D-X-X-X- [GAVLIMPFW] -X-X- [GAVLIMPFW] -X- 
[GAVLIMPFW] -X- [GAVLIMPFW] -X-X-X-X-F-X-X-Y-X-X-D 



Gleitklammer Region 2: 

PCNA_HUMAN : LKYYLAPKIE 

PCNAJVIETJA : LTFLLAPRIE 

MTH1312 : LSFLLAPRIE 

PHLA008 : LTFLLAPRVE 

AF0335 : VEYILAPRIE 

Konsensus : $XXXLAP&$E 

Pattern : [GAVLIMPFW] -X(3) -L-A-P- [KRHDE] - [GAVLIMPFW] -E 
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Fig. 5; 



Koppelnde Untereinheit : 



PHBN023 

PfuORF2 

DPD2_HUMAN 

MTH1405 

AF1790 

MJ0702 



FLEWLNGYVESKEEEEI VSRIRYLI IAGDWD 
FLEWLNGNVETKEEEEI VSRVKYLI IAGDWD 
LVDWTGQLGDEGEQCSAAHVSRVILAGNLLS 
FVKWINGDFGSEEQRSLAADVKYLWAGDIVD 
FVRWLKGEVGGKKSQNLAEKVKYIVIAGDIVD 
FIRFLNGDVDNELEEKWSRLKYICIAGDLVD 



Konsensus : F$XX$XGXXXXXXXXXXXXX$XY$X$AGD$$D 
L R - N S 

Pattern : [FL] - [GAVLIMPFW] -X-X- [GAVLIMPFW] -X-G-X(13' 
[GAVLIMPFW] -X- [YR] - [GAVLIMPFW] -X- [GAVLIMPFW] -A-G- [DN] ■ 
[GAVLIMPFW] - [GAVLIMPFW] - [DS] 



Fig. 6; 



Gleitklammerlader : 



AC1 INHUMAN 

AF2060 

MTH0241 

PHBN012 

MJ1422 



CNYLS KI I P ALQS RCTRFRFG PL 
CNYVSRI IEPIQSRCAVFRFKPV 
CNYSSKIIDPIQSRCAIFRFLPL 
CNYSSKI IEPIQSRCAIFRFRPL 
CNYPSKIIPPIQSRCAVFRFSPL 



Konsensus : CNYXSS:IIX$$QSRCXXFRFXP$ 

Pattern : C-N-Y-X-S- [KRHDE] -I-I-X- [GAVLIMPFW] - [GAVLIMPFW] 
Q-S-R-C-X-X-F-R-F-X-P- [GAVLIMPFW] 
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Fig. 7: 



Gleitklammerlader 2: 



AC15_HUMAN 

MJ0884 

AF1195 

MTH0240 

PHBN013 



KAALLSGPPGVGKTTTASLV 
KP I LLVGPPGCGKTTLAYAL 
KPLLLAGPPGVGKTSLALAL 
KPLLLVGPPGTGKTTLAHI I 
KALLLAGPPGSGKTTTVYAL 



Konsensus 



KXXLLXGPPGXGKT§X$XX$ 



Pattern : K-X-X-L-L-X-G-P- P-G-X-G-K-T- [STNQYC] -X- 
[GAVLIMPFW] -X-X- [GAVLIMPFW] 



Fig. 8: 



Elongationprotein 1 



DPOD_HUMAN 
DPOL_ARCFU 
MTH1208 
PHBT04 7 
MJ0885 



DVI TGYNIQNFDLP YLI SRA 
DI I VGYNQDAFDWPYLRKRA 
D I L VG YNSDNFD FP Y I TRRA 
DVI I TYNGDNFDFP YLLKRA 
DVI YTYNGDNFDFP YLKARA 



Konsensus 



D$$XXYNXXXFDXPY$XXRA 



Pattern : D- [GAVLIMPFW] - [GAVLIMPFW] -X-X-Y-N-X-X-X-F-D- 
X-P-Y- [GAVLIMPFW] -X-X-R-A 



ERSATZBLATT (REGEL 26) 
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Elongationsprotein 2 



AF1722 : AVRTAVAIMTEG WAAP I EG I ARVR I 

MJ1630 : AVRTALAVLTEGIVAAPLEGIADVKI 

PfuORF3 : AVRTALAI LTEG I VSAPLEG I ADVKI 

MTH1536 : ALRTALAI LTEG WAAPLEG I ARVR I 

PHBN021 : AVRTALAI LTEG WSAP I EG I ASVKI 

Konsensus : A$RTA$A$$TEGSVXAP$EGIAXV&I 



Pattern : A- [GAVLIMPFW] -R-T-A- [GAVLIMPFW] -A- [GAVLIMPFW] - 
[GAVLIMPFW] -T-E-G- [GAVLIMPFW] -V-X-A-P- [GAVLIMPFW] -E-G-T-A-X 
[KRHDE] -I 



Fig. 10: 



Elongationsprotein (Eubakteria) 



DP3A_ECOLI : VPVGPGRGSGAGSLVAYALKITDLDPLEFDLLFERFLNPERVSMPD 

DP3A_SALTY : VPVGPGRGSGAGSLVAYALKITDLDPLEFDLLFERFLNPERVSMPD 

BB0579 : I PVGAGRGSGAGS IVAYALRITDIDPLKYNLLFERFLNPERI SMPD 

DP3A_HELPY : I PVGPGRGSAAGSLVAFALKITDIDPLKYDLLFERFLNPERI SMPD 

AA50 : IPVGPGRGSAGGSLVAYAIGITDVDPIKHGFLFERFLNPERVSMPD 

Konsensus : $PVG$GRGSX$GS$VAXA$XITD$DP$XXX$LFERFLNPER$SMPD 

Pattern : [GAVLIMPFW] -P-V-G- [GAVLIMPFW] -G-R-G-S-X- [GAVLIMPFW] - 
G-S- [GAVLIMPFW] -V-A-X-A- [GAVLIMPFW] -X-I-T-D- [GAVLIMPFW] -D-P- 
[ GAVLIMPFW] -X-X-X- [GAVLIMPFW] -L-F-E-R-F-L-N-P-E-R- [GAVLIMPFW] -S-M- 
P-D . 
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Gleitklammer (Eubakteria) Region 1: 

AAPOL3B : KL VI TGGKS TYKLPTAPAEDFP 

DP3B_ECOLI : RMLVRSGRSRFSLSTLPAADFP 

S.TYPHIM. : RMLVRSGRSRFSLSTLPAADFP 

DP3B_PROMI : RLLVRSGRSRFSLSTLPASDFP 

DP3B_PSEPU : KLLVKAGRSRFTLSTLPANDFP 

DP3B_STRCO : RATWCGSSRFTLHTLPVEEYP 

Konsensus : &XX$XXGXSXXXLXT$P$X&XP 

Pattern : [KRHDE] -X-X- [GAVLIMPFW] -X-X-G-X-S-X-X-X-L-X-T 
[GAVLIMPFW] -?- [GAVLIMPFW] -X- [KRHDE] -X-P 

Gleitklammer (Eubakteria) Region 2; 



AAPOL3B 

DP3B_ECOLI 

S.TYPHIM. 

DP3B_PROMI 

DP3B_PSEPU 

DP3B STRCC 



IIMPMRV 
WMPMRL 
WMPMRL 
WMPMRL 
WMPMRL 
LIMPVRL 



Konsensus : $$MP$R$ 



Pattern 



[GAVLIMPFW] - [GAVLIMPFW) -M-P- [GAVLIMPFW] -R- [GAVLIMPFW] 
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Fig. 12: 



PCNA_HUMAN 

PCNA_METJA 

MTH1312 

PHLA008 

AF0335 



PCNA_HUMAN 

PCNA_METJA 

MTH1312 

PHLA008 

AF0335 



PCNA_HUMAN 

PCNA_METJA 

MTH1312 

PHLA008 

AF0335 



PCNA_HUMAN 

PCNA^METJA 

MTH1312 

PHLA008 

AF0335 



PCNA_HUMAN 

PCNA~METJA 

MTH1312 

PHLA008 

AF0335 




60 * 80 100 

: NKAKACTRLILELDEEKNKLNVIFENTG KRKFSLALXiDISASSVK- -VPEIEYPM 

s KRAKANDRVI LSTDEG -N - L 1 1 QFEGEA VRTFK^Trn t rv^^n ^ vPEIEYPN 

= KS I STKDLVEL I VEDE - STLKVKFGS VE YKVALIDPSAI^PrSS 

120 * 140 * 160 

: VVKMPSGEFARICRDLSHIGDAWISCAKDGVKFSASGELGNGNIKLSOT«!Mvnirc'i7i? 

180 * * 220 

UJGERIDKPARSIYSLDKIKEMLKADKFSETAIINLGDDMPL^^Q^^n! 
LIiDIEVQEETKSAYGVSYLflDMVKGIGKADEVTMRFGNE^ffMQMEYy^ ' 

LAPKIED : 236 
LAPRIEG : 226 
LAPRIEA : 221 
LAPRVEE : 227 
LAPRIES : 224 



114 
110 
109 
110 
109 



172 
163 
156 
163 
159 



229 
219 
214 
220 
217 
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20 



AAPOL3B 

DP3B_ECOLI 

S.TYPHIM. 

DP3B_PROMI 

DP3B_PSEPU 

DP3B STRCO 



40 



MRVKVDREEI^EVLKKARESTEKKAALPII^ . 58 

MKFTVEREHLLKPLQQVSG PLGGRPTLP I LGNLLLQVADGTLSLTGTDliEMEMVARVA • 58 

MKFTVEREHIiKPLQQVSGPliGGRPTLP ILGNLLLQVADGTLS LTGTDLEMEMVARVT • 58 

MKFIIEREQIiKPLQQVSGPLGGRPTLPILGNLIJj . 58 

MHFTIQREAMiKPWLVAGVVERRQTLPVLSWLLVVQGQQLSLTGTDLEVELVGRVO ■ 58 

MKIRVERDVIAEAVAWAARSLPARPPAPVLAGLLLKAEEGQLSLSSFDYEVSARVSVE • 58 



AAPOL3B 

DP3B_ECOLI 

S.TYPHIM. 

DP3B_PROMI 

DP3B_PSEPU 

DP3B STRCO 



fi 0 * 80 * ioo * 

GEVEEE-GEVCVHSQKLYDIVKNL-NSAYVYLHTEGEKLVITGGKSTY2CLPTAPAEDF • 114 

LVQPHEPGATTVPARKFFDICRGLPEGAEIAVQLEGERMLVRSGRSRFSLSTLPAADF : 116 

LSQPHEPGATTVPARKFFDICRGLPEGAEIAVQLEGDRMLVRSGRSRFSLSTLPAADF • 116 

LSQSHEIGATTVPARKFFDIWRGLPEGAEISVELDGDRLLVRSGRSRFSLSTLPASDF • 116 

LEEPAEPGEITVPARKLMDICKSLPNDALIDIKVDEQKLLVKAGRSRFTLSTLPANDF • 116 

AEIEEE-GTVLVSGRLLADISRAL-PNRPVEISTDGVRATVVCGSSRFTLHTLPVEEY • 114 



AAPOL3B 

DP3B_ECOLI 

S.TYPHIM. 

DP3B_PROMI 

DP3B_PSEPU 

DP3B STRCO 



120 



140 



_ 160 

PEFPEIVE-GGETLSGNLLVNGIEKVEYAIAKEEANIALQGMYLRGYEDRIHFVGSDG • 171 

PNU)DWQSEVEFTLPOATMKRLIEATQFSMAHQDVRYYI^GMLFErTEGEELRTVATDG ■ 174 

PNIiDDWQSEVEFTLPQATMKRLIESTQFSMAHQDVRYYLNGMLFETEGSELRTVATDG • 174 

PNLDDWOSEVEFTLPQATLKRLIEST^FSMAHQDVRYYLNGMLFETENTELRTVATDG • 174 

PTVEEGPGSLTCNLEOS KLRRLIERTS FAMAQQD VR YYLNGMLLEVSRNTLRAVS TDG • 174 

PALPQMPE - ATGTVPGEVFASAVQQVAIAAGRDDTLPVLTGVR I E IEGDS VTLASTDR ■ 171 



AAPOL3B 

DP3B_ECOLI 

S.TYPHIM. 

DP3B_PROMI 

DP3B_PSEPU 

DP3B STRCO 



180 * 200 * 220 * 

HRLALYEPLGEFSKEL LIPRKSLKVLKKLITGIEDVNIEKSE DESFAYFS : 221 

HRLAVCSMPIGQSLPS- -HSVIVPRKGVIELMRMLDG-GDNPLRVQI GSNNIRAH : 226 

HRLAVCSMPLEASLPS- -HSVIVPRKGVIELMRMLDG-GENPLRVQI GSNNIRAH : 226 

HRLAVCAMDIGQSLPG- -HSVIVPRKGVTELMRLLDGSGESLLQLQI GSNNLRAH : 227 

HRLALCSMSAP IEQEDR -HQVI VPRKGILELARLLTD - PEGMVS IVL GQHHIRAT : 227 

YRFAVRE FLWKPENPD I SAVALVPAKTLQDTAKALTSGDQ VILALSGSGAGEGL I GFE : 229 



AAPOL3B 

DP3B_ECOLI 

S.TYPHIM. 

DP3B_PROMI 

DP3B_PSEPU 

DP3B STRCO 



240 * 260 * 280 

TPEWKLAVRLLEGEFPDYMSVIPEEFSAEVLFETEEVLKVLKRLKALSEGKVFPVKIT : 279 

VGDFIFTSKLVDGRFPDYRRVLPKNPDKHLEAGCDLLKQAFARAAILSNEKFRGVRLY : 284 

VGDFIFTSKLVDGRFPDYRRVLPKKPDKHLEAGCDILKQAFARAAILSNEKFRGVRLY : 284 

VGDFIFTSKLVDGRFPDYRRVLPKNPTKTVIAGCDILKQAFSRAAILSNEKFRGVRIN -285 

TGEFTFTSKLVDGKFPDYERVLPKGGDKLWGDRQALREAFSRTAILSNEKYRGIRLQ -285 

GAGRRTTTRLLEGDLPKYKTLFPTEFNS VAVIETAPFVEAVKRVALVA - ERNTPVRLS : 286 



AAPOL3B 

DP3B_ECOLI 

S.TYPHIM. 

DP3B_PROMI 

DP3B^PSEPU 

DP3B STRCO 



300 * 320 * 340 

LSENLAIFEFADPEFGEAREEIEVEYTGEPFEIGFNGKYLMEALDAYDSERVWFKFTT 
VSENQLKITANNPEQEEAEEILDVTYSGAEMEIGFNVSYVLDVLNALKCENVRMMLT- 
VSENQLKITANNPEOEEAEEILDVSYGGTEMEIGFNVSYVLDVLNALKCETVRIMLT- 
LTNGQLKITANNPEQEEAEE I VDVQYQGEEMEIG FNVS YLLDVLNTLKCEEVKLLLT - 
LAAGQLKIQANNPEOEEAEEEISVDYEGSSLEIGFNVSYLLDVLGVMTTEQVRLILS- 
FEQGVLILEAGSSDDAQAVERVDAQLEGDDISIAFNPTFLIiDGLSAIDSPVAQLSFTT 



337 
341 
341 
342 
342 
344 



AAPOL3B 

DP3B_ECOLI 

S.TYPHIM. 

DP3B_PROMI 

DP3B_PSEPU 

DP3B STRCO 



* 360 * 380 

- - - PDTATLLEAEDYEK- EPYKCI IMPMRV - - 

DSVSSVQIEDAAS - QSAAYWMPMRL - - 

DSVSSVQIEDAAS -QSAAYWMPMRL- - 

DAVS S VQVENVAS - AAAAYWMPMRL - - 

DSNSS ALLQEAGN - DDS S YWMPMRL - - 



363 
366 
366 
367 
367 



STKPALLSGRPAVDAEADEAYKYLIMPVRLSG ; 376 
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ACl INHUMAN 

AF2060 

MTH0241 

PHBN012 

MJ1422 



20 * 40 60 

I CNYLS KI I PALQSRCTRFRFGPLTPELMVPRLEHWEEEKVD I SEDGMKALVTLS SGDM 
SCNYVSRIIEPIQSRCAVFRFKPVPKEAMKKRLLEICEKEGVKITEDGLEALIYISGGDF 
SCNYSSKIIDPIQSRCAIFRFLPLKGHQIIKRLEYIAEKENLEYEAHALETIVYFAEGDL 
SCNYSSKIIEPIQSRCAIFRFRPLRDEDIAKRLRYIAENEGLELTEEGLOAILYIAEGbM 
NCNYPSKIIPPIQSRCAVFRFSPLKKEDIAKKLKEIAEKEGLNLTESGLEAIIYVSEGDM 



60 
60 
60 
60 
60 



AC 1 INHUMAN 

AF2060 

MTO0241 

PHBN012 

MJ1422 



80 * ioo * 120 

RRALNILQSTNMAFGKVTEETVYTCTGHPLKSDIANI1J5WMLNQDFTTA . 120 

RKAIl^QGAAAIGEVVDADTIYQITATARPEEI^LIQTALKGNFMEARE ' 120 

RKAINLLQSAASLGEKITESSIYDWSRARPKDVRKMIKTIIJ)GKFME7 . 120 

RJIAINILQAAAALDKKITDENWMVASRARPEDIREMMLLALKGNFLKAR£KLREILL • 120 

RKAINVLQTAAALSDVTDDE I VYKVS S RARPEEVKKMMELALDGKFMEARDLL YKLMVEW - 120 



AC11_HUMAN : GLALHDILTEIHLFVHRVD : 13 9 

AF2060 : GMSGEDIVAQLFREIISMP : 13 9 

MTH0241 : GISGEDMVTQIYQELSRLA ; 139 

PHBN012 : GLSGEDVLIQMHKEVFNLP : 13 9 

MJ1422 : GMSGEDILNQMFREINSLD : 139 
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20 * 40 

AC15_HUMAN : LLWVDKYKPTSLKTI IGQOGDOSCANKLLRWLRNWQKSSSEDKKHAAKFGKFSGKDDG 

MJ0884 : LSWVEKYRPKSLKDVAG HEKVKEKLKTWIESYLKGET - 

AF1195 : MLWVEKYRPKTLEEWA DKS I ITRVI KWAKSWKRG 

MTH0240 : MSWTEKYRPGSFDEWG NQKVIAEIKEWIKAWKAGKP - 

PHBN013 : VPWIEKYRPRKLSEIVN QEQALEKVRAWIESWLHGNPPK 



60 * 80 * 100 * 

AC15_HUMAN : SSFKAALLSGPPGVGKTTTASLVCQELGYSYVELNASDTRSKSSLKAIVAESLNNTSI : 116 

MJ0884 : --PKPILLVGPPGCGKTTLAYAIANDYGFEVIELNASDKRNSSAIKKWGHAATSSSI : 93 

AF1195 : - - S KPLLLAG P PG VG KTS LAI^LANTOGWEAVELN AS DQRS WR V I ER I VGEGAFNET I • 91 

MTH0240 : - - QKPLLLVGPPGTGKTTLAHI IGKEFS - DTLELNASDRRSQDALMRS AGEASATRSL : 92 

PHBN013 : - -KKALLLAGPPGSGKTTTWALAHEYNFEVIELNASDER : 94 



120 * 140 * 160 * 

AC15_HUMAN : KGFYSNGAASSVSTKHALIMDEVDGMAGNEDRGGIQELIGLIK-HTKIPIICMCNDRN : 173 

MJ0884 : FG KKF-LIVLDEVDGISGKEDAGGVSELIKVIK-KAKNPIILTANDAY :' 139 

AF1195 : SDEGEF-LSSRIGKLKLIILDEVDNIHKKEDVGGEAALIRLIKRKPAOPLILIANDPY : 14 8 

MTH0240 : FN- HDLKLIILDEVDGIHGNEDRGGVQAINRI IK- ESRHPMVLTANDPY • 139 

PHBN013 : MG KRRKI IFLDEADNIE - - p - - SGAPEIAKLID - KARNPI IMAANHYW • 137 



180 * 200 * 220 * 

AC15_HUMAN : HPKIRSLVHYCFDLRFQRPRVEQIKGAMMS IAFKEGLKIPPPAMNEI ILGANQDIRQV : 231 

MJ0884 ; APSIRSLLPYVEVIQLNPVHTNSVYKVLKKIAEKEGLDVDDKTLKMIAQHSAGDLRSA : 197 

AF1195 : KLSP - ELRNLCEMINFKRLTKQQVARVLERIALKEGIKVDKSVLLKIAENAGGDLRAA : 205 

MTH0240 : SKRLQSIKPRCRVLNLRKVHTSSIAAALRRICRAEGIECPDDVLRELAKRSRGDLRSA : 197 

PHBN013 : EVPK-EIRDRAELVEYKRLNQRDVISALVRILKREGITVPKEILTEIAKRSSGDLRAA : 194 



240 * 260 * 280 * 

AC15_HUMAN : LHNLSMWCARS KALTYDQAKADSHRAKKD I KMGP FDVARKVFAAGEETAHMSLVDKSD : 289 

MJ0884 : INDLEALALSGDLSYEAAQKLP DRKREANI FDALRVI LKTTH YG I ATTALMN - - : 249 

AF1195 : INDFQALAEGKEELKPEDVFLT KRTQEKDI FRVMQM I FKTKNPAVYNEAML : 256 

MTH0240 : INDLEAMAEGEERIGEELLKMG EKDATSNLFDAVRAVLKSRDVSKVREAMR : 248 

PHBN013 : INDLQTIVAGG- - YEDAKYVLA YRDVEKTVFQSLGMVFSSDNAKRAKLALMN- - : 244 



300 * 320 * 340 

AC15_HUMAN : LFFHDYS IAPIiFVQENYIHVKPVAAGGDMKKHLMLLSRAADS ICDGDLVDSQIRSKQN : 347 

MJ0884 : VDETPDWIEWIAENVPKEYEKPEEVARAFEYLSKADRYLGRVMRRQN--YSF : 300 

AF1195 s LDES PED VIHWVDENLPLE YS G - VELVNAYEALS RAD I FLGRVRRRQF - - YRL : 306 

MTH024 0 : VDDDPTLVLEFIAENVPREYEKPNEISRAYDMLSRAJDIFFGRAVRTRN- - YTY : 299 

PHBN013 : LDMS PDE FLL WVDENT PHMYLKPEEMARAYEAI SRADI YLGRAQRTGN - - YSL : 295 



* 360 ♦ 380 * 400 

AC15_HUMAN : WSLLPAQAIYASVLPGELMRGYMTQFPTFPSWLGKHSSTGKHDRIVQDIJ^iHMSLRTY : 405 

MJ0884 : WKYATTLMTAGVALS KDEKYRKWTPYS Y - PKI FRLLiTKTKAEREILNKI LKKIGEKTH : 357 

AF1195 : WKYAS YLMTVGVQQMKEEPKKGFTRYRR - PAVWQMLFQLRQKREMTRKILEKIGKYSH : 363 

MTH0240 ; WRYASELMGPGVALAKDKTYRKFVRYTG - SSSFRI LGKTRKQRSLRDS VAAKMAGKMH : 356 

PHBN013 : WKYAI DMMTAG VA VAGTK - KKGFAKFYP - PNTLKMLAES KEERS IRDSI I KKIMKEMH : 351 



* 420 

AC15_HUMAN : SS KRTVNMDYLSLLR : 420 

MJ0884 : TSSKRAR - FDLQMLK : 371 

AF1195 : LSMRKARTEMFPVIK : 378 

MTH0240 : ISPKVAI - SMFPYME : 370 

PHBN013 .: MSKLEAL - ETMKILR : 365 
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Fig. 16: 



* 20 * 40 + 

PHBN023 : I FEVEDQTDRVKVFLPKDSED - YREALKVLPDAWAFKGVYSKRG - 1 FFANRFYLPDV 

PfuORF2 : I FEIEDLTGKVKVFLPKDSED - YREAFKVLPDAWAFKGVYSKRG - ILYANKFYLPDV 

DPD2_HUMAN : -LVLEDELQRIKLKGTIDVSK LVTGTVLAVFGSVRDDGKFLVEDYCFADLA 

MTH1405 : IIELEDDTGEISVWHNENHKLFEKSEKIVRDEWGVHGTKKGR- -FWASEIFHPGV 

AF1790 : YIRLEDTTGTITCVATGKNAE VARELLGDEVIGVTGLLKGS - - SLYANRIVFPDV 

MJ0702 : IVRIEDTEDEATLILPKEKIEAGKIPDDILLDEVIGAIGTVSKSGSSIYVDEIIRPAL 



PHBN023 

PfuORF2 

DPD2_HUMAN 

MTH1405 

AF1790 

MJ0702 



60 * 80 * 100 * 

PLYRK-QKPPLEEKVYAVLTSDIHVGSK- -EFCEKAFIKFLEWLNGYVESKEEEEIVS : 111 

PLYRR - QKPPLEEKVYAILI SDIHVGSK- - EFCENAFIKFLEWLNGNVETKEEEEI VS : 111 

PQKP- -APP-LDTDRFVLLVSGLGLGGGGGESLLGT-QLLVDVVTGQLGDEGEQCSAA : 104 

PRIQ- -EK EMDFSVAFISDVHIGSQ- -TFLEDAFMKFVKWINGDFGSEEQRSLAA : 107 

PINGNGEK KRDFYIVFLSDTHFGSK- -EFLEKEWEMFVRWLKGEVGGKKSQNLAE : 106 

PPKEP-KR- - IDEEIYMAFLSDIHVGSK- -EFLHKEFEKFIRFLNGDVDNELEEKWS : 111 



PHBN023 

PfuORF2 

DPD2_HUMAN 

MTH1405 

AF1790 

MJ0702 



120 * 140 * 160 * 

RIRYLIIAGDWD-GIGIYP-GQYSDLIIPDIFDQYEALANLLSNVP KHITIFI : 163 

RVKYL I IAGDWD - GVGVYP - GQYADLTI PDI FDQYEALANLLSHVP KHITMFI : 163 

HVSRVILAGNLLSHSTQSRDSINKAKYLTKKTQAASVEAVK^EILLQLSASVPVDV : 162 

DVKYLWAGDITO-GIGIYP-GQEKELLIRDIHEQYEEAARLFGDIR SDIKIVM : 159 

KVKYIVIAGDIVD-GIGVYP-GQEDDLAISDIYGQYEFAASHLDEIP KEIKIIV : 158 

RLKYICIAGDLVD- GVGVYP -GQEEDL YE VDIIEQYREIAMYLDQIP EHISIII : 163 



180 * 200 * 220 * 

PHBN023 : GPGNHDAARPAIPQPEFYEEYAKPLYKLKNTVIISNPAVIRLHGRDFLIAHGRGIEDV : 221 

PfuORF2 : APGNHDAARQAIPQPEFYKEYAKPI YKLKNAVI ISNPAVIRLHGRDFLIAHGRG IEDV : 221 

DPD2_HUMAN : MPGEFDPTNYTLPQQPLHPCMFPLATAYSTLQLVTNPYQATIDGVRFLGTSGQNVSDI : 220 

MTH1405 : IPGNHDSSRIAEPQPAIPEEYAKSLYSIRNIEFLSNPSLVSLDGVRTLIYHGRSFDDM : 217 

AF1790 : SPGNHDAVRQAEPQPAFEGEI -RSLFP - KNVEHVGNPAYVDIEGVKVLI YHGRS IDDI : 214. 

MJ0702 : SPGNHDAVRPAEPQPKLPEKITKLFNR-DNIYFVGNPCTLNIHGFDTLL YHGRS FDDL : 220 



240 * 260 * 280 

PHBN023 : VS FVPGLTHHKPGLPMVELLKMRHLAPTFGGKVPI APDPE - DLLVIEEVPDLVQMGHV : 278 

PfuORF2 : VGS VPGLTHHKPGLPMVELLKMRHVAPMFGGKVPIAPDPE - DLLVIEEVPDWHMGHV : 278 

DPD2_HUMAN : FR YS S MEDHLE I LEWTLR VRH I S PTAPDTLG CY P FYKTD P F I F PECPHVYFCGNT : 275 

MTH1405 : AMSVNGLSHERSDLIMEELLEKRHLAPIYGERTPLASEIE-DHLVIDEVPHVLHTGHV : 274 

AF1790 : ISKIPRLSYDEPQKVMEELLKRRHLSPIYGGRTPLAPERE-DYLVIEDVPDILHCGHI : 271 

MJ0702 ; VGQIRAASYENPVTIMKELIKRRLLCPTYGGRCPIAPEHK-DYLVIDRDIDILHTGHI : 277 



300 * 320 

PHBN023 : HVYDTAVYRG VQLVNSATWQAQTEFQKMVNIVPTPGLVPIVD : 32 0 

PfuORF2 : HVYDAWYRG VQLVNS ATWQAQTE FQKMVN I VPTP AKVPWD : 320 

DPD2_HUMAN : PSFGSKI IRGPEDQTVLLVTVPDF - S ATQTACLVNLR- SLACQPISF : 320 

MTH1405 : HINAYKKYKG VHLINSGTFQSQTEFQKIYNIVPTCGQVPVLN : 316 

AF1790 : HTYGTGFYRG VFMVNS STWQAQTEFQKKVNLNPMPGNVAVYR : 313 

MJ0702 : HINGYGIYRG WMVNSGTFQEQTDFQKRMG I S PTPAI VPI IN : 319 
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* 20 * 40 * 

DPOD_HUMAN : KVQSY^KEEDLLOAWSTFIRIMDPDVITGYNIQNFDLPYLISRAOTLKVQTFPFLGRV : 58 

DPOL_ARCFU : EIILTGDERKIISDFVKLIKSYDPDIIVGYNQDAFDWPYLRKRAERWNIPLD--VG-- : 54 

MTH1208 : FVEVVEDERELLERFAEIVIDKKPDILVGYNSDNFDFPYITRRAAILGAELD- -LG- - : 54 

PHBT047 : YVEVVSSEREMIKRLIRVTKEKDPDVI ITYNGDNFDFPYLLKRAEKLGIKLL- - LG - - : 54 

MJ0885 : NIEWKNEKELI KKI IETLKE Y - - DVI YTYNGDNFDFP YLKARAKI YGIDIN - - LG - - : 52 

60 * 80 * 100 * 

DPOD_HUMAN : AGLCSNI RDSSFQS KQTGRRDTKWSMVGRVQMDMLQVLLRE YKLRSHTLNAVS FHFL : 116 

DPOL_ARCFU : - RDGSNWFRGG RPKITGRLNVDLYDIAMRISDIKIKKLENVAEFLG : 100 

MTH1208 : WDGS KI RTMRRG - FANATAIKGTVHVDLYPVMRRYMNLDRYTLERVYQELF : 104 

PHBT047 : - -RDNSEPKMQKMG-DSLAVEIKGRIHFDLFPVIRRTINLPTYTLEAVYEAIF : 104 

MJ0885 : KDGEELKIKRGG-MEYRSYIPGRVHIDLYPISRRLLKLTKYTLEDVVYNLF : 102 



120 * 140 * 160 

DPOD_HUMAN : GEQKE - DVQHS I ITDLQNGNDQTRRRLAVYCLKDAYLPLRLLERLMVLVNAVEMARVT : 173 

DPOL_ARCFU : TKIEIADIEAKDIYRYWSRGE- -KEKVLNYARQDAINTYLIAK- -ELLPMHYELSKMI : 154 

MTH1208 : GEEKI - DLPGDRLWEYWDRDEL - RDELFR YSLDD WATHR I AE - - KI LPLNLELTRLV : 158 

PHBT047 : GKPKE - KVYADE I AKAWETGEG - LERVAKYSMEDAKVTYELGR - - EFFPMEAQLARLV : 158 

MJ0885 : GIEKL - KIPHTKI VDYWANND - - - KTLIEYSLQDAKYTYKIGK- - YFFPLEVMFSRIV : 154 



180 * 200 * 220 * 

DPOD_HUMAN : GVPLSYLLSRGQQVKWSQLLRQAMHEGLLMPWKSE GGEDYTGATVTEPLK : 225 

DPOL_ARCFU : RLPVDDVTRMGRGKQVDWLLLSEAKKIGEIAPNPPE- - HAESYEGAFVLEPER : 205 

MTH1208 : GQPLFDISRMATGQQAEWFLVRKAYQYGELVPNKPSQSDFSSRRGRRAVGGYVKEPEK ': 216 

PHBT047 : GQPVWDVSRSSTGNLVEWFLLRKAYERNELAPNKPDEKEYERRLRESYEGGYVKEPEK : 216 

MJ0885 : NQTPFEITRMSSG0^1VEYLLMKRAFKENMIVPNKPDEEE^YRRRVLTTYEGGYVKEPEK : 212 
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GY YDVP I ATLDFS 


238 


DPOL_ARCFU 


GLHEN-VACLDFA 


217 


MTH1208 


GLHEN - IVQFDFR 


228 


PHBT047 


GLWEG - IVSLDFR 


228 


MJ0885 


GMFED - I I SMDFR 


224 
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AF1722 

MJ1630 

PfuORF3 

MTH1536 

PHBN021 



20 * 40 

GD VKC I KGMTS KQK I VE PLEKAI LRAI NEVYVFiSgTTRTO CTO VP VTOF^MF T wtwitt^ " 

dklkgvmgmtsgwkiaepi^kgi^raknevyvfkdgS^ : 63 

80 * 10Q 

sas : = 126 

PfuORF3 = BLGYTOJFEGKPLVSEDWVELKPOTVILsl^^ : ™ 

MTH1536 : EUnraWXSGDBM^ : 126 

PHBN02 1 : -V^FEG^SEOQX^^ . g . 



140 * 160 



170 



AF1722 : EDLIGHLVIGIAPHTSAGVLGRIIGFSDVLAGYAHPYFHAAKRP • 
MJ1630 : EDLIGHLVIGMAPHTSAGMVGRI IG YTKANVGYAHPYFH^ ■' l\ fl 
PfuORF3 : EDLIGHLVIGLAPHTSAGIVGRIIGFVDALVGYAHPYniAATOR !70 
MTH1S36 : EDLVGHLIAGIAPHTSAAVLGRIIGFTGASACYWIPYFBSA1SR ' 
PHBN021 : EDLIGHLVIGIAPHTSAGIVGRIIGFVD^SpY^S 70 
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ELOVINOMGFPGYFLIVMEFIQWSKDNGVPVGPGRGSGAGSLVAYALKITOLnPTr^T 6 , 0 
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BB0579 
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AA50 



VLGHPYGFVDRISKLIPP : 138 

VLGHPYGFVDRISKLVPP : 13 8 

VLDIPFAESNELTKFIPD : 138 

VLDMPYKEADDFAKLIPN : 138 

AMGLPYSTADKLAKLIPQ : 133 



ERSATZBLATT (REGEL 26) 



WO 00/08164 



Fig. 20 



Polymerase — 



PCT/DE99/02480 

) 



16/28 



A. B. 



PCNA— «- 

123456 12345678 



ERSATZBLATT (REGEL 26) 



WO 00/08164 



17/28 



PCT/DE99/02480 
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Fig. 23 



A. fulgidus PCNA: 

A. fulgidus Polymerase: 
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Fig. 24 
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Fig. 25 
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Fig. 26 
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Fig. 27 
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Status 


Die akfaette Version bosteht aus 3Q52878 Bntrigen uod wurcteT 
am 30 M^99&tggfctftert. 


Soschieibung— 


Das Europ&sebeatoinfo^ unt€H^§^uni§-^ 
vertretbHBe ^faMtfclhideciteSe^eroe databaseVHuropas 
priroSre Quelte fifr tfakleofldsequefgrfaten. Das EBt ufiterfiSR ~- 
und verffelbTte ZtearnmenatBaEp^Spos Bairoch voxu&r 
Univer^ta^efifeteflfells^ie SVWSS^Piot Protein Sequeoce 
database*. Stecfiinfeig zusatzficbe^^pezSalisierte tnntefccflai^ 
btologlscteOatent^ ebenso vw^dTtwarG^ t 
und Dc^jmenlriBfeRen, dioWMbTelniTaiblologen von Interest 
sind. Die £Dt ttetawaK-Dienste nmfassen DatenbanksudieiHKt- 
SequenzvesjieicNseinrichte^D. 




Patric^tSoc^Epez^m^ ,£eterJ*45©ehr Graham^.^Gameron 

und ToHssJ^rSoffis, The£HcegeffifcBfef^ 

(EBI) dstobasfi^^eic 1996- 
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Die akfcteHe V e rs i on besteht aus 80 8g&€fflfrSg cn undwuiiieam 
30. Juti; l3994 g g&acrt 



H e&hrei b ung 



Die 'S WTS S ^rg^ rotein ^q u e nce dat a b ase 1 tst em e TTal e nb aQl^ 
m'rt Pro tc l h&cq i^gg^ dieiSaSasafTTOeaarbeit vo nAmc»Bai r od i4^ 
(Universft3t^OTg^B#derSS®r^feF®bliothek ^sfSffwrafer- 
Die Dateafe.SsffisJS ot si nrt r f^ 
Qberseteungenatts^ter 'aeBfcj te c teo^de ^Sequc 
Obemofsrae n b us d e rPIR^ SaBW^ Haj gr o t^n Ide 
Resou rce^, c fahLi tBUAkif eriLiiumiH^to ^fe* direkt vorFFgra&erru^ 
Qberm ift e fc worfenfSi e enffiateteg^gegge Anmefeffl gen;lst - 
nich W ed u ii d dnt wtd"iii ete t£faev ^ffffise^u diver 
Daten banRen, -u xk .'EMBL mtcfemsseqi 
der PROS! tEpHfiSro datafii^^^P-DB. S\ 
-eine gegfle gte ProtoinsoqaGnzdatcnbDnk ^-die ber nfliifiotjpfa 
tiohes Ma&afl^Q Wl^on e n4^^ 
eines P roteins, s^ ^DoTT^ ^^ufeto yposttrans lation a Te 
Modifikafe m^'gai^ ten /cfc),: ^ minim ales Mafr^an^ 

Datenbanken 2U fefem. Dfej»H<aw:E*^ 
Dat eaban £5sg5 a ^n ; eineJaBBgBg^goa Anzahl *»mf Omfang . 



Er ^eHung vor^TfEMB L, ei nem^ftidff -eflroTierten ; 
^fe^ ies e r^satebe ste htao^mte ^n in einem^Swjss^ra^ 
Shn lichen Format; xfe von defBbefse&un g aller k odlbiwiS& r 
Sfequsnzen ^CDS) der EMBOtticBaBgB^equenceiSggase 
■abgete^^ft^W^n-die nfcht^ s cho n in Swisses* 
*efriHalten .stocL- . 



J anes Bamcteaad R o lf ApwafaT fee^WlSS-PRC ff protei n— 



sequ e nce datcrixmfra nd i fetaq^fcme flgTREMBL-^^^c Aad&J. 
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htta/ZexBasy Erape.*a^ii^ 




Die akfaetie Version tcstofat ods 41tfl44^mtragCT.und wurde am *■ 
30. Juli t99a.iegistriefl- 


Heschreibung-- 


TrEMBfc tst*ffre^m^er«annofo^ " 
die ein ^saterzarPrDteinsKjuefizdatenfaank SWlSSPJlOTist 
TrEMBt eitimmm&SB^ 

(CDS), rijiHn riftrH^ _ 
and noGh^tcht tn SWtSSBRQTORt^gert sind. 
TfcMBUtann^temDQ^Vors^ 

warden jflffipr^infiflg^ zuf^aaggrfl^. ~ 
Swiss-Prei- ^tiali^at^fymrte^Grd^ sollten, v^teSw^ " 
Prot - Zagar gswrnmem-iuguteilt: TjCMBL ist in 
HauptseRDuiiew^ft^f^SPTBSEtiiffll REMTRFWRr 




-SP 1 KHWW -(SWfStaaaa 4^fcMa.^e«feilt die ESfcSge.udfc 
^tztenendes^^SW&Sfrkb 1 xingetHjui werden seffiea. 
SV\flSSP^T-7iioanosnmTimenu^^ alie smiBm^=, 
Eintrage=vgrgetefh 


LiiBJBlur 


Amos Bauudu*Htff^-Ap^^ 




Res.25tf3T38£4997 



O 1 nORDET' 








htto://www;eE^-4iJe^ 


~ BesGhrelbunw 


Die aktue^Version tiesteht-aus t99794gntrageirefid3a^ 
4. Augii^19Q9reafetriert : 
siehe JnSfcflBtT 




siohe ,TffEt$Bfe* 


-. 




■ ncinDLiiciv 






nicht verfOgbar 


^States 


Die a ktuefle Version testehtaus 71306 entrSgen und^rde^am - 
4. AugustdaOOjpggtriert- 




Diese r>alotT«fiTv wg»alldie Uixlnh^zaEletzten vdtetSndigen.. ~^ 
VersiorwopPR^W8&- 


.titeratar 


siehe/ltEMBfc* 



GENPEPT ~ 




ttRL 




Status 


Die aktu^yfttsinfT-testefi!- p w 4f 2243 : Bntragen und wwrfe 
30. Juli 4999 rooioMcrt 


fBsschvethung 

i. 


GENPE^fi^iat^iuMium^ ,Tte e ine riliHi^Oiinjri^ 
neuesteo^s«m=g^ENB?^^arst€ttl Das Program**- 4 
^reato^GoriPopTwurde vonmfRA^Gunnell am NCI, USA 
geschnebenjundvouG. Vasssebtbekif^ 
Qberaitettet^unraraftn^ 
lauffahigzuseia, 


LttUixiluf 


Rains Qufiti&n^fettttQpar 
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SEQUENZPROTOKOLL 



(1) ALLGEMEINE ANGABEN: 

(i) ANMELDER: 

(A) NAME: LION bioscience AG 

(B) STRASSE: Im Neuenheimer Feld 517 

(C) ORT: Heidelberg 

(E) LAND: DE 

(F) POSTLEITZAHL: 69120 

(ii) BEZEICHNUNG DER ERFINDUNG: Akzessorische Komplexe mit 

Polymeraseaktivitaet 

(iii) ANZAHL DER SEQUENZEN: 54 

(iv) COMPUTER-LESBARE FASSUNG: 

(A) DATENTRAGER: Floppy disk 

(B) COMPUTER: IBM PC compatible 

(C) BETRIEBSSYSTEM: PC-DOS/MS-DOS 

(D) SOFTWARE: Patentln Release #1.0, Version #1.30 (EPA) 



(2) ANGABEN ZU SEQ ID NO: 1: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 340 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: beides 

(ii) ART DES MOLEKULS: Protein 

(vi) URSPRUNLICHE HERKUNFT: 

(A) ORGANISMUS: Homo sapiens 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 1: 

Met Glu Thr Ser Ala Leu Lys Gin Gin Glu Gin Pro Ala Ala Thr Lys 
15 10 15 

lie Arg Asn Leu Pro Trp Val Glu Lys Tyr Arg Pro Gin Thr Leu Asn 
20 25 30 

Asp Leu lie Ser His Gin Asp lie Leu Ser Thr He Gin Lys Phe lie 
35 40 45 
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Asn Glu Asp Arg Leu Pro His Leu Leu Leu Tyr Gly Pro Pro Gly Thr 
50 55 60 

Gly Lys Thr Ser Thr lie Leu Ala Cys Ala Lys Gin Leu Tyr Lys Asp 
65 70 75 80 

Lys Glu Phe Gly Ser Met Val Leu Glu Leu Asn Ala Ser Asp Asp Arg 
85 90 95 

Gly lie Asp He He Arg Gly Pro lie Leu Ser Phe Ala Ser Thr Arg 
100 105 110 

Thr lie Phe Lys Lys Gly Phe Lys Leu Val lie Leu Asp Glu Ala Asp 
115 120 125 

Ala Met Thr Gin Asp Ala Gin Asn Ala Leu Arg Arg Val lie Glu Lys 
130 135 140 

Phe Thr Glu Asn Thr Arg Phe Cys Leu lie Cys Asn Tyr Leu Ser Lys 
145 150 155 160 

He He Pro Ala Leu Gin Ser Arg Cys Thr Arg Phe Arg Phe Gly Pro 
165 170 175 

Leu Thr Pro Glu Leu Met Val Pro Arg Leu Glu His Val Val Glu Glu 
180 185 190 

Glu Lys Val Asp lie Ser Glu Asp Gly Met Lys Ala Leu Val Thr Leu 
195 200 205 

Ser Ser Gly Asp Met Arg Arg Ala Leu Asn lie Leu Gin Ser Thr Asn 
210 215 220 

Met Ala Phe Gly Lys Va! Thr Glu Glu Thr Val Tyr Thr Cys Thr Gly 
225 230 235 240 

His Pro Leu Lys Ser Asp He Ala Asn He Leu Asp Trp Met Leu Asn 
245 250 255 

Gin Asp Phe Thr Thr Ala Tyr Arg Asn He Thr Glu Leu Lys Thr Leu 
260 265 270 

Lys Gly Leu Ala Leu His Asp lie Leu Thr Glu lie His Leu Phe Val 
275 280 285 

His Arg Val Asp Phe Pro Ser Ser Val Arg He His Leu Leu Thr Lys 
290 295 300 

Met Ala Asp He Glu Tyr Arg Leu Ser Val Gly Thr Asn Glu Lys He 
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305 310 315 320 

Gin Leu Ser Ser Leu He Ala Ala Phe Gin Val Thr Arg Asp Leu lie 
325 330 335 

Val Ala Glu Ala 
340 

(2) ANGABEN ZU SEQ ID NO: 2: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 319 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(vi) URSPRUNLICHE HERKUNFT: 

(A) ORGANISMUS: Archaeoglobus fulgidus 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 2: 

Met Glu Asn Phe Glu lie Trp Val Glu Lys Tyr Arg Pro Arg Thr Leu 
15 10 15 

Asp Glu Val Val Gly Gin Asp Glu Val He Gin Arg Leu Lys Gly Tyr 
20 25 30 

Val Glu Arg Lys Asn He Pro His Leu Leu Phe Ser Gly Pro Pro Gly 
35 40 45 

Thr Gly Lys Thr Ala Thr Ala He Ala Leu Ala Arg Asp Leu Phe Gly 
50 55 60 

Glu Asn Trp Arg Asp Asn Phe lie Glu Met Asn Ala Ser Asp Glu Arg 
65 70 75 80 

Gly He Asp Val Val Arg His Lys He Lys Glu Phe Ala Arg Thr Ala 
85 90 95 

Pro He Gly Gly Ala Pro Phe Lys He He Phe Leu Asp Glu Ala Asp 
100 105 110 

Ala Leu Thr Ala Asp Ala Gin Ala Ala Leu Arg Arg Thr Met Glu Met 
115 120 125 
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Tyr Ser Lys Ser Cys Arg Phe lie Leu Ser Cys Asn Tyr Val Ser Arg 
130 135 140 

lie lie Glu Pro lie Gin Ser Arg Cys Ala Val Phe Arg Phe Lys Pro 
145 150 155 160 

Val Pro Lys Glu Ala Met Lys Lys Arg Leu Leu Glu He Cys Glu Lys 
165 170 175 

Glu Gly Val Lys lie Thr Glu Asp Gly Leu Glu Ala Leu He Tyr lie 
.180 185 190 

Ser Gly Gly Asp Phe Arg Lys Ala lie Asn Ala Leu Gin Gly Ala Ala 
195 200 205 

Ala lie Gly Glu Val Val Asp Ala Asp Thr lie Tyr Gin He Thr Ala 
210 215 220 

Thr Ala Arg Pro Glu Glu Met Thr Glu Leu lie Gin Thr Ala Leu Lys 
225 230 235 240 

Gly Asn Phe Met Glu Ala Arg Glu Leu Leu Asp Arg Leu Met Val Glu 
245 250 255 

Tyr Gly Met Ser Gly Qlu Asp lie Val Ala Gin Leu Phe Arg Glu He 
260 265 270 

lie Ser Met Pro lie Lys Asp Ser Leu Lys Val Gin Leu lie Asp Lys 
275 280 285 

Leu Gly Glu Val Asp Phe Arg Leu Thr Glu Gly Ala Asn Glu Arg lie 
290 295 300 

Gin Leu Asp Ala Tyr Leu Ala Tyr Leu Ser Thr Leu Ala Lys Lys 
305 310 315 

(2) ANGABEN ZU SEQ ID NO: 3: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 1 847 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(vi) URSPRONLICHE HERKUNFT: 

(A) ORGANISMUS: Methanococcus jannaschii 
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(xi) SEQUENZBESCHREiBUNG: SEQ ID NO: 3: 

Met Val lie lie Met Glu Lys Pro Trp Val Glu Lys Tyr Arg Pro Lys 
15 10 15 

Thr Leu Asp Asp lie Val Gly Gin Asp Glu lie Val Lys Arg Leu Lys 
20 25 30 

Lys Tyr Val Glu Lys Lys Ser Met Pro His Leu Leu Phe Ser Gly Pro 
35 40 45 

Pro Gly Val Gly Lys Cys Leu Thr Gly Asp Thr Lys Val He Val Asn 
50 55 60 

Gly Glu He Arg Glu lie Gly Glu Val lie Glu Glu He Ser Asn Gly 
65 70 75 80 

Lys Phe Gly Val Thr Leu Thr Asn Asn Leu Lys Val Leu Gly He Asp 
85 90 95 

Glu Asp Gly Lys He Arg Glu Phe Asp Val Gin Tyr Val Tyr Lys Asp 
100 105 110 

Lys Thr Asn Thr Leu lie Lys lie Lys Thr Lys Met Gly Arg Glu Leu 
115 ' 120 125 

Lys Val Thr Thr Tyr His Pro Leu Leu lie Asn His Lys Asn Gly Glu 
130 135 140 

lie Lys Trp Glu Lys Ala Glu Asn Leu Lys Val Gly Asp Lys Leu Ala 
145 150 155 160 

Thr Pro Arg Tyr He Leu Phe Asn Glu Ser Asp Tyr Asn Glu Glu Leu 
165 170 175 

Ala Glu Trp Leu Gly Tyr Phe lie Gly Asp Gly His Ala Asp Lys Glu 
180 185 190 

Ser Asn Lys lie Thr Phe Thr Asn Gly Asp Glu Lys Leu Arg Lys Arg 
195 200 205 

Phe Ala Glu Leu Thr Glu Lys Leu Phe Lys Asp Ala Lys lie Lys Glu 
210 215 220 

Arg He His Lys Asp Arg Thr Pro Asp He Tyr Val Asn Ser Lys Ght 
225 230 235 240 

Ala Val Glu Phe He Asp Lys Leu Gly Leu Arg Gly Lys Lys Ala Asp 
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245 250 255 

Lys Val Arg He Pro Lys Glu lie Met Arg Ser Asp Ala Leu Arg Ala 
260 265 270 

Phe Leu Arg Ala Tyr Phe Asp Cys Asp Gly Gly lie Glu Lys His Ser 
275 280 285 

He Val Leu Ser Thr Ala Ser Lys Glu Met Ala Glu Asp Leu Val Tyr . 
290 295 300 

Ala Leu Leu Arg Phe Gly lie He Ala Lys Leu Arg Glu Lys Val Asn 
305 310 315 320 

Lys Asn Asn Asn Lys Val Tyr Tyr His He Val He Ser Asn Ser Ser 
325 330 335 

Asn Leu Arg Thr Phe Leu Asp Asn lie Gly Phe Ser Gin Glu Arg Lys 
340 345 350 

Leu Lys Lys Leu Leu Glu He lie Lys Asp Glu Asn Pro Asn Leu Asp 
355 360 365 

Val He Thr He Asp Lys Glu Lys lie Arg Tyr He Arg Asp Arg Leu 
370 375 380 

Lys Val Lys Leu Thr Arg Asp lie Glu Lys Asp Asn Trp Ser Tyr Asn 
385 390 395 400 

Lys Cys Arg Lys He Thr Gin Glu Leu Leu Lys Glu lie Tyr Tyr Arg 
405 410 415 

Leu Glu Glu Leu Lys Glu He Glu Lys Ala Leu Glu Glu Asn He Leu 
420 425 430 

lie Asp Trp Asp Glu Val Ala Glu Arg Arg Lys Glu He Ala Glu Lys 
435 440 445 

Thr Gly He Arg Ser Asp Arg lie Leu Glu Tyr He Arg Gly Lys Arg 
450 ~ 455 460 

Lys Pro Ser Leu Lys Asn Tyr lie Lys lie Ala Asn Thr Leu Gly Lys 
465 470 475 480 

Asn He Glu Lys He He Asp Ala Met Arg He Phe Ala Lys Lys Tyr 
485 490 495 

Ser Ser Tyr Ala Glu He Gly Lys Met Leu Asn Met Trp Asn Ser Ser 
500 505 510 
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Me Lys lie Tyr Leu Glu Ser Asn Thr Gin Glu lie Glu Lys Leu Glu 
515 520 525 

Glu lie Arg Lys Thr Glu Leu Lys Leu Val Lys Glu lie Leu Asn Asp 
530 535 540 

Glu Lys Leu lie Asp Ser lie Gly Tyr Val Leu Phe. Leu Ala Ser Asn 
545 550 555 560 

Glu lie Tyr Trp Asp Glu lie Val Glu He Glu Gin Leu Asn Gly Glu 
565 570 575 

Phe Thr He Tyr Asp Leu His Val Pro Arg Tyr His Asn Phe lie Gly 
580 585 590 

Gly Asn Leu Pro Thr He Leu His Asn Thr Thr Ala Ala Leu Cys Leu 
595 600 605 

Ala Arg Asp Leu Phe Gly Glu Asn Trp Arg Asp Asn Phe Leu Glu Leu 
610 615 620 

Asn Ala Ser Val Ser Lys Asp Thr Pro lie Leu Val Lys He Asp Gly 
625 630 635 640 

Lys Val Lys Arg Thr Thr Phe Glu Glu Leu Asp Lys lie Tyr Phe Glu 
645 650 655 

Thr Asn Asp Glu Asn Glu Met Tyr Lys Lys Val Asp Asn Leu Glu Val 
660 665 670 

Leu Thr Val Asp Glu Asn Phe Arg Val Arg Trp Arg Lys Val Ser Thr 
675 680 685 

He lie Arg His Lys Val Asp Lys He Leu Arg He Lys Phe Glu Gly 
690 * 695 700 

Gly Tyr He Glu Leu Thr Gly Asn His Ser He Met Met Leu Asp Glu 
705 710 715 720 

Asn Gly Leu Val Ala Lys Lys Ala Ser Asp lie Lys Val Gly Asp Cys 
725 730 735 

Phe Leu Ser Phe Val Ala Asn He Glu Gly Glu Lys Asp Arg Leu Asp 
740 745 750 

Leu Lys Glu Phe Glu Pro Lys Asp lie Thr Ser Arg Val Lys He lie 
755 760 765 

Asn Asp Phe Asp He Asp Glu Asp Thr Ala Trp Met Leu Gly Leu Tyr 
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770 775 780 

Vai Ala Glu Gly Ala Val Gly Phe Lys Gly Lys Thr Ser Gly Gin Val 
785 790 795 800 

lie Tyr Thr Leu Gly Ser His Glu His Asp Leu He Asn Lys Leu Asn 
805 810 815 

Asp He Val Asp Lys Lys Gly Phe Ser Lys Tyr Glu Asn Phe Thr Gly 
820 825 830 

Ser Gly Phe Asp Arg Lys Arg Leu Ser Ala Lys Gin lie Arg lie Leu 
835 840 845 

Asn Thr Gin Leu Ala Arg Phe Val Glu Glu Asn Phe Tyr Asp Gly Asn 
850 855 860 

Gly Arg Arg Ala Arg Asn Lys Arg He Pro Asp lie lie Phe Glu Leu 
865 870 875 880 

Lys Glu Asn Leu Arg Val Glu Phe Leu Lys Gly Leu Ala Asp Gly Asp 
885 890 895 

Ser Ser Gly Asn Trp Arg Glu Val Val Arg lie Ser Ser Lys Ser Asp 
900 905 910 

Asn Leu Leu He Asp Thr Val Trp Leu Ala Arg lie Ser Gly lie Glu 
915 920 925 

Ser Ser He Phe Glu Asn Glu Ala Arg Leu He Trp Lys Gly Gly Met 
930 935 940 

Lys Trp Lys Lys Ser Asn Leu Leu Pro Ala Glu Pro He He Lys Met 
945 950 955 960 

He Lys Lys Leu Glu Asn Lys He Asn Gly Asn Trp Arg Tyr lie Leu 
965 970 975 

Arg His Gin Leu Tyr Glu Gly Lys Lys Arg Val Ser Lys Asp Lys He 
980 985 990 

Lys Gin lie Leu Glu Met Val Asn Val Glu Lys Leu Ser Asp Lys Glu 
995 1000 1005 

Lys Glu Val Tyr Asp Leu Leu Lys Lys Leu Ser Lys Thr Glu Leu Tyr 
1010 1015 1020 

Ala Leu Val Val Lys Glu lie Glu lie He Asp Tyr Asn Asp Phe Val 
1025 1030 1035 1040 
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Tyr Asp Val Ser Val Pro Asn Asn Glu Met Phe Phe Ala Gly Asn Val 
1045 1050 1055 

Pro He Leu Leu His Asn Ser Asp Glu Arg Gly He Asp Val ile Arg 
1060 1065 1070 

Thr Lys Val Lys Asp Phe Ala Arg Thr Lys Pro lie Gly Asp Val Pro 
1075 1080 1085 

Phe Lys Ile lie Phe Leu Asp Glu Ser Asp Ala Leu Thr Ala Asp Ala 
1090 1095 1100 

Gin Asn Ala Leu Arg Arg Thr Met Glu Lys Tyr Ser Asp Val Cys Arg 
1105 1110 1115 1120 

Phe lie Leu Ser Cys Leu Thr Gly Asp Ala Lys lie Thr Leu Pro Asp 
1125 1130 1135 

Glu Arg Glu Ile Lys lie Glu Asp Phe Ile Lys Met Phe Glu Glu Arg 
1140 1145 1150 

Lys Leu Lys His Val Leu Asn Arg Asn Gly Glu Asp Leu Val Leu Ala 
1155 1160 1165 

Gly Va! Lys Phe Asn Ser Lys Ile Val Asn His Lys Val Tyr Arg Leu 
1170 1175 1180 

Val Leu Glu Ser Gly Arg Glu Ile Glu Ala Thr Gly Asp His Lys Phe 
1185 1190 1195 1200 

Leu Thr Arg Asp Gly Trp Lys Glu Val Tyr Glu Leu Lys Glu Asp Asp 
1205 1210 1215 

Glu Val Leu Val Tyr Pro Ala Leu Glu Gly Val Gly Phe Glu Val Asp 
1220 1225 1230 

Glu Arg Arg lie Ile Gly Leu Asn Glu Phe Tyr Glu Phe Leu Thr Asn 
1235 1240 1245 

Tyr Glu lie Lys Leu Gly Tyr Lys Pro Leu Gly Lys Ala Lys Ser Tyr 
1250 1255 1260 

Lys Glu Leu Ile Thr Arg Asp Lys Glu Lys lie Leu Ser Arg Val Leu 
1265 1270 1275 1280 

Glu Leu Ser Asp Lys Tyr Ser Lys Ser Glu lie Arg Arg Lys lie Glu 
1285 1290 1295 

Glu Glu. Phe Gly Ile Lys lie Ser Leu Thr Thr lie Lys Asn Leu Ile 
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1300 1305 1310 

Asn Gly Lys He Asp Gly Phe Ala Leu Lys Tyr Val Arg Lys He Lys 
1315 1320 1325 

Glu Leu Gly Trp Asp Glu He Thr Tyr Asp Asp Glu Lys Ala Gly He 
1330 1335 1340 

Phe Ala Arg Leu Leu Gly Phe lie lie Gly Asp Gly His Leu Ser Lys 
1345 1350 1355 1360 

Ser Lys Glu Gly Arg lie Leu He Thr Ala Thr He Asn Glu Leu Glu 
1365 1370 1375 

Gly He Lys Lys Asp Leu Glu Lys Leu Gly He Lys Ala Ser Asn lie 
1380 1385 1390 

He Glu Lys Asp lie Glu His Lys Leu Asp Gly Arg Glu He Lys Gly 
1395 1400 1405 

Lys Thr Ser Phe lie Tyr He Asn Asn Lys Ala Phe Tyr Leu Leu Leu 
1410 1415 1420 

Asn Phe Trp Gly Val Glu He Gly Asn Lys Thr lie Asn Gly Tyr Asn 
1425 1430. 1435 1440 

He Pro Lys Trp He Lys Tyr Gly Asn Lys Phe Val Lys Arg Glu Phe 
1445 1450 1455 

Leu Arg Gly Leu Phe Gly Ala Asp Gly Thr Lys Pro Tyr He Lys Lys 
1460 1465 1470 

Tyr Asn He Asn Gly He Lys Leu Gly He Arg Val Glu Asn He Ser 
1475 1480 1485 

Lys Asp Lys Thr Leu Glu Phe Phe Glu Glu Val Lys Lys Met Leu Glu 
1490 1495 1500 

Glu Phe Glu Val Glu Ser Tyr He Lys Val Ser Lys He Asp Asn Lys 
1505 1510 1515 1520 

Asn Leu Thr Glu Leu lie Val Lys Ala Asn Asn Lys Asn Tyr Leu Lys 
1525 1530 1535 

Tyr Leu Ser Arg He Ser Tyr Ala Tyr Glu Lys Asp Asn Phe Ala Arg 
1540 1545 1550 

Leu Val Gly Glu Tyr Leu Arg He Lys Glu Ala Tyr Lys Asp He lie 
1555 1560 1565 
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Leu Lys Glu lie Ala Glu Asn Ala Leu Lys Glu Ala Asp Gly Glu Lys 
1570 1575 1580 

Ser Leu Arg Glu Leu Ala Arg Lys Tyr Asn Val Pro Val Asp Phe He 
1585 1590 1595 1600 

lie Asn Gin Leu Lys Gly Lys Asp lie Gly Leu Pro Arg Asn Phe Met 
1605 1610 1615 

Thr Phe Glu Glu Phe Leu Lys Glu Lys Val Val Asp Gly Lys Tyr Val 
1 620 1 625 1 630 

Ser Glu Arg lie He Lys Lys Glu Cys He Gly Tyr Arg Asp Val Tyr 
1635 1640 1645 

Asp He Thr Cys His Lys Asp Pro Ser Phe He Ala Asn Gly Phe Val 
1650 1655 1660 

Ser His Asn Cys Asn Tyr Pro Ser Lys He He Pro Pro lie Gin Ser 
1665 1670 1675 1680 

Arg Cys Ala Val Phe Arg Phe Ser Pro Leu Lys Lys Glu Asp He Ala 
1685 1690 1695 

Lys Lys Leu Lys Glu He Ala Glu Lys Glu Gly Leu Asn Leu Thr Glu 
1700 1705 1710 

Ser Gly Leu Glu Ala lie lie Tyr Val Ser Glu Gly Asp Met Arg Lys 
1715 1720 1725 

Ala lie Asn Val Leu Gin Thr Ala Ala Ala Leu Ser Asp Val He Asp 
1730 1735 1740 

Asp Glu He Val Tyr Lys Val Ser Ser Arg Ala Arg Pro Glu Glu Val 
1745 1750 1755 1760 

Lys Lys Met Met Glu Leu Ala Leu Asp Gly Lys Phe Met Glu Ala Arg 
1765 1770 1775 

Asp Leu Leu Tyr Lys Leu Met Val Glu Trp Gly Met Ser Giy Glu Asp 
1780 1785 1790 

lie Leu Asn Gin Met Phe Arg Glu He Asn Ser Leu Asp lie Asp Glu 
1795 1800 1805 

Arg Lys Lys Val Glu Leu Ala Asp Ala He Gly Glu Thr Asp Phe Arg 
1810 1815 1820 

He Val Glu Gly Ala Asn Glu Arg He Gin Leu Ser AJa Leu Leu Ala 
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1825 1830 1835 1840 

Lys Met Ala Leu Met Gly Arg 
1845 

(2) ANGABEN ZU SEQ ID NO: 4: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 855 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: Protein 

(vi) URSPRUNLICHE HERKUNFT: 

(A) ORGANISMUS: Pyrococcus horikoshii 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 4: 

Met His Asn Met Glu Glu Val Arg Glu Val Lys Val Leu Glu Lys Pro 
1 5 10 15 

Trp Val Glu Lys Tyr Arg Pro Gin Arg Leu Asp Glu He Val Gly Gin 
20 25 30 

Glu His He Val Lys Arg Leu Lys His Tyr Val Lys Thr Gly Ser Met 
35 40 45 

Pro His Leu Leu Phe Ala Gly Pro Pro Gly Val Gly Lys Cys Leu Thr 
50 55 60 

Gly Asp Thr Lys Val He Ala Asn Gly Gin Leu Phe Glu Leu Arg Glu 
65 70 75 80 

Leu Val Glu Lys lie Ser Gly Gly Lys Phe Gly Pro Thr Pro Val Lys 
85 90 95 

Giy Leu Lys Val He Gly He Asp Glu Asp Gly Lys Leu Arg Glu Phe 
100 105 110 

Glu Val Gin Tyr Val Tyr Lys Asp Lys Thr Glu Arg Leu He Arg He 
115 120 125 

Arg Thr Arg Leu Gly Arg Glu Leu Lys Val Thr Pro Tyr His Pro Leu 
130 * 135 140 
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Leu Val Asn Arg Arg Asn Gly Glu lie Lys Trp Val Lys Ala Glu Glu 
145 150 155 160 

Leu Lys Pro Gly Asp Lys Leu Ala Val Pro Arg Phe Leu Pro lie Val 
165 170 ~175 

Thr Gly Glu Asp Pro Leu Ala Glu Trp Leu Gly Tyr Phe Leu Gly Gly 
180 185 190 

Gly Tyr Ala Asp Ser Lys Glu Asn Leu He Met Phe Thr Asn Glu Asp 
195 200 205 

Pro Leu Leu Arg Gin Arg Phe Met Giu Leu Thr Glu Lys Leu Phe Ser 
210 215 220 

Asp Ala Arg He Arg Glu lie Thr His Glu Asn Gly Thr Ser Lys Val 
225 " 230 235 240 

Tyr Val Asn Ser Lys Lys Ala Leu Lys Leu Val Asn Ser Leu Gly Asn 
245 250 255 

Ala His lie Pro Lys Glu Cys Trp Arg Gly He Arg Ser Phe Leu Arg 
260 265 270 

Ala Tyr Phe Asp Cys Asn Gly Gly Val Lys Gly Asn Ala He Val Leu 
275 280 285 

Ala Thr Ala Ser Lys Glu Met Ser Gin Glu He Ala Tyr Ala Leu Ala 
290 295 300 

Gly Phe Gly He lie Ser Arg lie Gin Glu Tyr Arg Val lie lie Ser 
305 310 315 320 

Gly Ser Asp Asn Val Lys Lys Phe Leu Asn Glu lie Gly Phe He Asn 
325 330 335 

Arg Asn Lys Leu Glu Lys Ala Leu Lys Leu Val Lys Lys Asp Asp Pro 
340 345 350 

Gly His Asp Gly Leu Glu lie Asn Tyr Glu Leu lie Ser Tyr Val Lys 
355 360 365 

Asp Arg Leu Arg Leu Ser Phe Phe Asn Asp Lys Arg Ser Trp Ser Tyr 
370 375 380 

Arg Glu Ala Lys Giu lie Ser Trp Glu Leu Met Lys Glu He Tyr Tyr 
385 390 395 400 

Arg Leu Asp Glu Leu Glu Lys Leu Lys Glu Ser Leu Ser Arg Gly lie 
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405 410 415 

Leu He Asp Trp Asn Glu Val Ala Lys Arg He Glu Glu Val Ala Glu 
420 425 430 

Glu Thr Gly lie Arg Ala Asp Glu Leu Leu Glu Tyr lie Glu Gly Lys 
435 440 445 

Arg Lys Leu Ser Phe Lys Asp Tyr lie Lys He Ala Lys Val Leu Gly 
450 455 460 

He Asp Val Glu His Thr He Glu Ala Met Arg Val Phe Ala Arg Lys 
465 470 475 480 

Tyr Ser Ser Tyr Ala Glu He Gly Arg Arg Leu Gly Thr Trp Asn Ser 
485 490 495 

Ser Val Lys Thr He Leu Glu Ser Asn Ala Val Asn Vafdu He Leu 
500 505 510 

Glu Arg lie Arg Lys He Glu Leu Glu Leu lie Glu Glu lie Leu Ser 
515 ~ 520 525 

Asp Glu Lys Leu Lys Glu Gly lie Ala Tyr Leu He Phe Leu Ser Gin 
530 535 540 

Asn Glu Leu Tyr Trp Asp Glu lie Thr Lys Val Glu Glu Leu Arg Gly 
545 550 555 560 

Glu Phe lie lie Tyr Asp Leu His Val Pro Gly Tyr His Asn Phe He 
565 570 575 

Ala Gly Asn Met Pro Thr Val Val His Asn Thr Thr Ala Ala Leu Ala 
580 585 590 

Leu Ser Arg Glu Leu Phe Gly Glu Asn Trp Arg His Asn Phe Leu Glu 
595 600 605 

Leu Asn Ala Ser Asp Glu Arg Gly He Asn Val lie Arg Glu Lys Val 
610 615 620 

Lys Glu Phe Ala Arg Thr Lys Pro He Gly Gly Ala Ser Phe Lys He 
625 630 635 640 

He Phe Leu Asp Glu Ala Asp Ala Leu Thr Gin Asp Ala Gin Gin Ala 
645 650 655 

Leu Arg Arg Thr Met Glu Met Phe Ser Ser Asn Val Arg Phe He Leu 
660 665 670 
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Ser Cys Asn Tyr Ser Ser Lys He He Glu Pro He Gin Ser Arg Cys 
675 680 685 

Ala lie Phe Arg Phe Arg Pro Leu Arg Asp Glu Asp He Ala Lys Arg 
690 695 700 

Leu Arg Tyr He Ala Glu Asn Glu Gly Leu Glu Leu Thr Glu Glu Gly 
705 710 715 720 

Leu Gin Ala lie Leu Tyr He Ala Glu Gly Asp Met Arg Arg Ala He 
725 730 735 

Asn He Leu Gin Ala Ala Ala Ala Leu Asp Lys Lys lie Thr Asp Glu 
740 745 750 

Asn Val Phe Met Val Ala Ser Arg Ala Arg Pro Glu Asp He Arg Glu 
755 760 765 

Met Met Leu Leu Ala Leu Lys Gly Asn Phe Leu Lys Ala Arg Glu Lys 
770 775 780 

Leu Arg Glu lie Leu Leu Lys Gin Gly Leu Ser Gly Glu Asp Val Leu 
785 790 795 800 

He Gin Met His Lys Glu Val Phe Asn Leu Pro lie Asp Glu Pro Thr 
805 810 815 

Lys Val Tyr Leu Ala Asp Lys He Gly Glu Tyr Asn Phe Arg Leu Val 
820 825 830 

Glu Gly Ala Asn Glu Met He Gin Leu Glu Ala Leu Leu Ala Gin Phe 
835 840 845 

Thr Leu Val Gly Lys Lys Lys 
850 855 

(2) ANGABEN ZU SEQ ID NO: 5: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 321 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(vi) URSPRUNLICHE HERKUNFT: 

(A) ORGANISMUS: Methanobacterium thermoautotrophicum 
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(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 5: 

Met lie He Met Asn Gly Pro Trp Val Glu Lys Tyr Arg Pro Gin Lys 
1 5 10 15 

Leu Asp Asp lie Val Gly Gin Glu His lie lie Pro Arg Leu Lys Arg 
20 25 30 

Tyr Val Glu Glu Lys Ser Met Pro Asn Leu Met Phe Thr Gly Pro Ala 
35 40 . 45 

Gly Val Gly Lys Thr Thr Ala Ala Leu Ala Leu Ala Arg Glu lie Leu 
50 55 60 

Gly Glu Tyr Trp Arg Gin Asn Phe Leu Glu Leu Asn Ala Ser Asp Ala 
65 70 75 80 

Arg Gly He Asp Thr Val Arg Thr Ser He Lys Asn Phe Cys Arg Leu 
85 90 95 

Lys Pro Val Gly Ala Pro Phe Arg He He Phe Leu Asp Glu Val Asp 
100 105 110 

Asn Met Thr Lys Asp Ala Gin His Ala Leu Arg Arg Glu Met Glu Met 
115 '120 125 

Tyr Thr Lys Thr Ser Ser Phe lie Leu Ser Cys Asn Tyr Ser Ser Lys 
130 135 140 

lie He Asp Pro lie Gin Ser Arg Cys Ala He Phe Arg Phe Leu Pro 
145 150 155 160 

Leu Lys Gly His Gin He He Lys Arg Leu Glu Tyr He Ala Glu Lys 
165 170 175 

Glu Asn Leu Glu Tyr Glu Ala His Ala Leu Glu Thr lie Val Tyr Phe 
180 185 190 

Ala Glu Gly Asp Leu Arg Lys Ala lie Asn Leu Leu Gin Ser Ala Ala 
195 200 205 

Ser Leu Gly Glu Lys He Thr Glu Ser Ser He Tyr Asp Val Val Ser 
210 215 220 

Arg Ala Arg Pro Lys Asp Val Arg Lys Met He Lys Thr He Leu Asp 
225 ~ 230 235 240 

Gly Lys Phe Met Glu Ala Arg Asp Met Leu Arg Glu lie Met Val Leu 



ERSATZBLATT (REGEL 26) 



WO 00/08,64 PCT/DE99/02480 

17 



245 250 255 

Gin Gly lie Ser Gly Glu Asp Met Val Thr Gin lie Tyr Gin Glu Leu 
260 265 270 

Ser Arg Leu Ala Met Glu Gly Glu Val Asp Gly Asp Arg Tyr Val Gly 
275 280 285 

Leu lie Asp Ala lie Gly Glu Tyr Asp Phe Arg lie Arg Glu Gly Ala 
290 295 300 

Asn Pro Arg He Gin Leu Glu Ala Leu Leu Ala Arg Phe Leu Glu His 
305 " 310 315 320 

Ala 



(2) ANGABEN ZU SEQ ID NO: 6: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 1148 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(vi) URSPRUNLICHE HERKUNFT: 

(A) ORGANISMUS: Homo sapiens 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 6: 

Met Asp lie Arg Lys Phe Phe Gly Val lie Pro Ser Gly Lys Lys Leu 
1 5 10 15 

Val Ser Glu Thr Val Lys Lys Asn Glu Lys Thr Lys Ser Asp Glu Glu 
20 25 30 

Thr Leu Lys Ala Lys Lys Gly lie Lys Glu He Lys Val Asn Ser Ser 
35 40 45 

Arg Lys Glu Asp Asp Phe Lys Gin Lys Gin Pro Ser Lys Lys Lys Arg 
50 55 60 

lie He Tyr Asp Ser Asp Ser Glu Ser Glu Glu Thr Leu Gin Val Lys 
65 70 75 80 
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Asn Ala Lys Lys Pro Pro Giu Lys Leu Pro Val Ser Ser Lys Pro Gly 
85 90 95 

Lys lie Ser Arg Gin Asp Pro Val Thr Tyr lie Ser Glu Thr Asp Glu 
100 105 110 

Glu Asp Asp Phe Met Cys Lys Lys Ala Ala Ser Lys Ser Lys Giu Asn 
115 120 125 

Gly Arg Ser Thr Asn Ser His Leu Gly Thr Ser Asn Met Lys Lys Asn 
130 135 140 

Glu Glu Asn Thr Lys Thr Lys Asn Lys Pro Leu Ser Pro He Lys Leu 
145 150 155 160 

Thr Pro Thr Ser Val Leu Asp Tyr Phe Gly Thr Gly Ser Val Gin Arg 
165 170 175 

Ser Asn Lys Lys Met Val Ala Ser Lys Arg Lys Glu Leu Ser Gin Asn 
180 185 190 

Thr Asp Glu Ser Gly Leu Asn Asp Glu Ala lie Ala Lys Gin Leu Gin 
195 200 205 

Leu Asp Glu Asp Ala Giu Leu Glu Arg Gin Leu His Glu Asp Glu Glu 
210 215 220 

Phe Ala Arg Thr Leu Ala Met Leu Asp Glu Glu Pro Lys Thr Lys Lys 
225 230 235 240 

Ala Arg Lys Asp Thr Glu Ala Gly Glu Thr Phe Ser Ser Val Gin Ala 
245 250 255 

Asn Leu Ser Lys Ala Glu Lys His Lys Tyr Pro His Lys Val Lys Thr 
260 265 270 

Ala Gin Val Ser Asp Glu Arg Lys Ser Tyr Ser Pro Arg Lys Gin Ser 
275 280 285 

Lys Tyr Glu Ser Ser Lys Glu Ser Gin Gin His Ser Lys Ser Ser Ala 
290 295 300 

Asp Lys lie Gly Glu Val Ser Ser Pro Lys Ala Ser Ser Lys Leu Ala 
305 310 315 320 

lie Met Lys Arg Lys Lys Glu Ser Ser Tyr Lys Glu He Glu Pro Val 
325 330 335 

Ala Ser Lys Arg Lys Glu Asn Ala lie Lys Leu Lys Gly Glu Thr Lys 
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340 345 350 

Thr Pro Lys Lys Thr Lys Ser Ser Pro Ala Lys Lys Glu Ser Val Ser 
355 360 365 

Pro Glu Asp Ser Glu Lys Lys Arg Thr Asn Tyr Gin Ala Tyr Arg Ser 
370 375 380 

Tyr Leu Asn Arg Glu Gly Pro Lys Ala Leu Gly Ser Lys Glu lie Pro 
385 390 395 400 

Lys Gly Ala Glu Asn Cys Leu Glu Gly Leu lie Phe Val He Thr Gly 
405 410 415 

Val Leu Glu Ser lie Glu Arg Asp Glu Ala Lys Ser Leu lie Glu Arg 
420 425 430 

Tyr Gly Gly Lys Val Thr Gly Asn Val Ser Lys Lys Thr Asn Tyr Leu 
435 440 445 

Val Met Gly Arg Asp Ser Gly Gin Ser Lys Ser Asp Lys Ala Ala Ala 
450 455 460 

Leu Gly Thr Lys lie lie Asp Glu Asp Gly Leu Leu Asn Leu He Arg 
465 470 475 480 

Thr Met Pro Gly Lys Lys Ser Lys Tyr Glu lie Ala Val Glu Thr Glu 
485 490 495 

Met Lys Lys Glu Ser Lys Leu Glu Arg Thr Pro Gin Lys Asn Val Gin 
500 505 510 

Gly Lys Arg Lys He Ser Pro Ser Lys Lys Glu Ser Glu Ser Lys Lys 
515 520 525 

Ser Arg Pro Thr Ser Lys Arg Asp Ser Leu Ala Lys Thr He Lys Lys 
530 535 540 

Glu Thr Asp Val Phe Trp Lys Ser Leu Asp Phe Lys Glu Gin Val Ala 
545 550 555 560 

Glu Glu Thr Ser Gly Asp Ser Lys Ala Arg Asn Leu Ala Asp Asp Ser 
565 570 575 

Ser Glu Asn Lys Val Glu Asn Leu Leu Trp Val Asp Lys Tyr Lys Pro 
580 585 590 

Thr Ser Leu Lys Thr lie He Gly Gin Gin Gly Asp Gin Ser Cys Ala 
595 600 605 
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Asn Lys Leu Leu Arg Trp Leu Arg Asn Trp Gin Lys Ser Ser Ser Glu 
610 615 620 

Asp Lys Lys His Ala Ala Lys Phe Gly Lys Phe Ser Gly Lys Asp Asp 
625 630 635 640 

Gly Ser Ser Phe Lys Ala Ala Leu Leu Ser Gly Pro Pro Gly Val Gly 
645 650 655. 

Lys Thr Thr Thr Ala Ser Leu Val Cys Gin Glu Leu Gly Tyr Ser Tyr 
660 665 670 

Val Glu Leu Asn Ala Ser Asp Thr Arg Ser Lys Ser Ser Leu Lys Ala 
675 680 685 

lie Val Ala Glu Ser Leu Asn Asn Thr Ser He Lys Gly Phe Tyr Ser 
690 695 700 

Asn Gly Ala Ala Ser Ser Val Ser Thr Lys His Ala Leu lie Met Asp 
705 710 715 720 

Glu Val Asp Gly Met Ala Gly Asn Glu Asp Arg Gly Gly He Gin Glu 
725 730 735 

Leu lie Gly Leu He Lys His Thr Lys He Pro lie lie Cys Met Cys 
740 745 750 

Asn Asp Arg Asn His Pro Lys He Arg Ser Leu Va! His Tyr Cys Phe 
755 760 765 

Asp Leu Arg Phe Gin Arg Pro Arg Val Glu Gin lie Lys Gly Ala Met 
770 ~ 775 780 

Met Ser lie Ala Phe Lys Glu Gly Leu Lys He Pro Pro Pro Ala Met 
785 790 795 800 

Asn Glu lie lie Leu Gly Ala Asn Gin Asp He Arg Gin Val Leu His 
805 810 815 

Asn Leu Ser Met Trp Cys Ala Arg Ser Lys Ala Leu Thr Tyr Asp Gin 
820 825 830 

Ala Lys Ala Asp Ser His Arg Ala Lys Lys Asp He Lys Met Gly Pro 
835 840 845 

Phe Asp Val Ala Arg Lys Val Phe Ala Ala Gly Glu Glu Thr Ala His 
850 855 860 

Met Ser Leu Val Asp Lys Ser Asp Leu Phe Phe His Asp Tyr Ser lie 
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865 870 875 880 

Ala Pro Leu Phe Val Gin Glu Asn Tyr lie His Val Lys Pro Val Ala 
885 890 895 

Ala Gly Gly Asp Met Lys Lys His Leu Met Leu Leu Ser Arg Ala Ala 
900 905 910 

Asp Ser lie Cys Asp Gly Asp Leu Val Asp Ser Gin lie Arg Ser Lys 
915 920 925 

Gin Asn Trp Ser Leu Leu Pro Ala Gin Ala lie Tyr Ala Ser Val Leu 
930 935 940 

Pro Gly Glu Leu Met Arg Gly Tyr Met Thr Gin Phe Pro Thr Phe Pro 
945 950 955 960 

Ser Trp Leu Gly Lys His Ser Ser Thr Gly Lys His Asp Arg He Val 
965 970 975 

Gin Asp Leu Ala Leu His Met Ser Leu Arg Thr Tyr Ser Ser Lys Arg 
980 985 990 

Thr Val Asn Met Asp Tyr Leu Ser Leu Leu Arg Asp Ala Leu Val Gin 
995 1000 1005 

Pro Leu Thr Ser Gin Gly Val Asp Gly Val Gin Asp Val Val Ala Leu 
1010 1015 1020 

Met Asp Thr Tyr Tyr Leu Met Lys Glu Asp Phe Glu Asn He Met Glu 
1025 1030 1035 1040 

lie Ser Ser Trp Gly Gly Lys Pro Ser Pro Phe Ser Lys Leu Asp Pro 
1045 1050 1055 

Lys Val Lys Ala Ala Phe Thr Arg Ala Tyr Asn Lys Glu Ala His Leu 
1060 1065 1070 

Thr Pro Tyr Ser Leu Gin Ala He Lys Ala Ser Arg His Ser Thr Ser 
1075 1080 1085 

Pro Ser Leu Asp Ser Glu Tyr Asn Glu Glu Leu Asn Glu Asp Asp Ser 
1090 1095 1100 

Gin Ser Asp Glu Lys Asp Gin Asp Ala He Glu Thr Asp Ala Met He 
1105 1110 1115 1120 

Lys Lys Lys Thr Lys Ser Ser Lys Pro Ser Lys Pro Glu Lys Asp Lys 
1125 1130 1135 
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Glu Pro Arg Lys Gly Lys Gly Lys Ser Ser Lys Lys 
1140 1145 

(2) ANGABEN ZU SEQ ID NO: 7: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 479 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(vi) URSPRUNLICHE HERKUNFT: 

(A) ORGANISMUS: Archaeoglobus fulgidus 



(xi) SEQUENZBESCHRE1BUNG: SEQ ID NO: 7: 

Met Leu Trp Val Glu Lys Tyr Arg Pro Lys Thr Leu Glu Glu Val Val 
15 10 15 

Ala Asp Lys Ser lie He Thr Arg Val lie Lys Trp Ala Lys Ser Trp 
20 25 30 

Lys Arg Gly Ser Lys Pro Leu Leu Leu Ala Gly Pro Pro Gly Val Gly 
35 40 45 

Lys Thr Ser Leu Ala Leu Ala Leu Ala Asn Thr Met Gly Trp Glu Ala 
50 55 60 

Val Glu Leu Asn Ala Ser Asp Gin Arg Ser Trp Arg Val He Glu Arg 
65 70 75 80 

lie Val Gly Glu Gly Ala Phe Asn Glu Thr lie Ser Asp Glu Gly Glu 
85 90 95 

Phe Leu Ser Ser Arg He Gly Lys Leu Lys Leu He He Leu Asp Glu 
100 105 110 

Val Asp Asn He His Lys Lys Glu Asp Val Gly Gly Glu Ala Ala Leu 
115 120 125 

lie Arg Leu He Lys Arg Lys Pro Ala Gin Pro Leu He Leu He Ala 
130 135 140 

Asn Asp Pro Tyr Lys Leu Ser Pro Glu Leu Arg Asn Leu Cys Glu Met 
145 150 155 160 
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lie Asn Phe Lys Arg Leu Thr Lys Gin Gin Val Ala Arg Val Leu Glu 
165 170 175 

Arg lie Ala Leu Lys Glu Gly He Lys Val Asp Lys Ser Val Leu Leu 
180 185 190 

Lys lie Ala Glu Asn Ala Gly Gly Asp Leu Arg Ala Ala lie Asn Asp 
195 200 205 

Phe Gin Ala Leu Ala G!u Gly Lys Glu Glu Leu Lys Pro Glu Asp Val 
210 215 220 

Phe Leu Thr Lys Arg Thr Gin Glu Lys Asp lie Phe Arg Val Met Gin 
225 230 235 240 

Met lie Phe Lys Thr Lys Asn Pro Ala Val Tyr Asn Glu Ala Met Leu 
245 250 255 

Leu Asp Glu Ser Pro Glu Asp Val He His Trp Val Asp Glu Asn Leu 
260 265 270 

Pro Leu Glu Tyr Ser Gly Val Glu Leu Val Asn Ala Tyr Glu Ala Leu 
275 280 285 

Ser Arg Ala Asp He Phe Leu Gly Arg Val Arg Arg Arg Gin Phe Tyr 
290 295 30Q 

Arg Leu Trp Lys Tyr Ala Ser Tyr Leu Met Thr Val Gly Val Gin Gin 
305 310 315 320 

Met Lys Glu Giu Pro Lys Lys Gly Phe Thr Arg Tyr Arg Arg Pro Ala 
325 330 335 

Va! Trp Gin Met Leu Phe Gin Leu Arg Gin Lys Arg Glu Met Thr Arg 
340 345 350 

Lys He Leu Glu Lys He Gly Lys Tyr Ser His Leu Ser Met Arg Lys 
355 360 365 

Ala Arg Thr Glu Met Phe Pro Val He Lys Leu Leu Leu Lys Glu Leu 
370 375 380 

Asp Val Asp Lys Ala Ala Thr He Ala Ala Phe Tyr Glu Phe Thr Lys 
385 390 395 400 

Glu Glu Leu Glu Phe Leu Val Gly Glu Lys Gly Asp Glu He Trp Lys 
405 410 415 

Tyr Val Glu Lys His Gly Met His Arg He Glu Asp Glu Thr Phe Leu 
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420 425 430 

Glu Ser Phe Val Lys Ala Glu Lys Glu Glu Lys Glu Glu Ser Val Glu 
435 440 445 

Glu Val Ala Glu Glu Lys Pro Glu Glu Glu Arg Glu Glu Pro Arg Ala 
450 455 460 

Arg Lys Lys Ala Gly Lys Asn Leu Thr Leu Asp Ser Phe Phe Ser 
465 470 475 

(2) ANGABEN ZU SEQ ID NO: 8: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 516 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(vi) URSPRONLICHE HERKUNFT: 

(A) ORGANISMUS: Methanococcus jannaschii 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 8: 

Met Leu Ser Trp Val Glu Lys Tyr Arg Pro Lys Ser Leu Lys Asp Val 
1 5 10 " 15 

Ala Gly His Glu Lys Val Lys Glu Lys Leu Lys Thr Trp lie Glu Ser 
20 25 30 

Tyr Leu Lys Gly Glu Thr Pro Lys Pro lie Leu Leu Val Gly Pro Pro 
35 40 45 

Gly Cys Gly Lys Thr Thr Leu Ala Tyr Ala Leu Ala Asn Asp Tyr Gly 
50 55 60 

Phe Glu Val lie Glu Leu Asn Ala Ser Asp Lys Arg Asn Ser Ser Ala 
65 70 75 80 

He Lys Lys Val Val Gly His Ala Ala Thr Ser Ser Ser lie Phe Gly 
85 90 95 

Lys Lys Phe Leu He Val Leu Asp Glu Val Asp Gly He Ser Gly Lys 
100 105 110 
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Glu Asp Ala Gly Gly Val Ser Glu Leu lie Lys Val He Lys Lys A'a 
115 120 125 

Lys Asn Pro He He Leu Thr Ala Asn Asp Ala Tyr Ala Pro Ser lie 
130 135 140 

Arg Ser Leu Leu Pro Tyr Val Glu Val lie Gin Leu Asn Pro Val His 
145 150 155 160 

Thr Asn Ser Val Tyr Lys Val Leu Lys Lys He Ala Glu Lys Glu Gly 
165 170 175 

Leu Asp Val Asp Asp Lys Thr Leu Lys Met lie Ala Gin His Ser Ala 
180 185 190 

Gly Asp Leu Arg Ser Ala He Asn Asp Leu Glu Ala Leu Ala Leu Ser 
1 95 200 205 

Gly Asp Leu Ser Tyr Glu Ala Ala Gin Lys Leu Pro Asp Arg Lys Arg 
210 215 220 

Glu Ala Asn He Phe Asp Ala Leu Arg Val lie Leu Lys Thr Thr His 
225 230 235 240 

Tyr Gly He Ala Thr Thr Ala Leu Met Asn Val Asp Glu Thr Pro Asp 
245 250 255 

Val Val He Glu Trp He Ala Glu Asn Val Pro Lys Glu Tyr Glu Lys 
260 265 270 

Pro Glu Glu Val Ala Arg Ala Phe Glu Tyr Leu Ser Lys Ala Asp Arg 
275 280 285 

Tyr Leu Gly Arg Val Met Arg Arg Gin Asn Tyr Ser Phe Trp Lys Tyr 
290 295 300 

Ala Thr Thr Leu Met Thr Ala Gly Val Ala Leu Ser Lys Asp Glu Lys 
305 310 315 320 

Tyr Arg Lys Trp Thr Pro Tyr Ser Tyr Pro Lys He Phe Arg Leu Leu 
325 330 335 

Thr Lys Thr Lys Ala Glu Arg Glu He Leu Asn Lys lie Leu Lys Lys 
340 345 350 

He Gly Glu Lys Thr His Thr Ser Ser Lys Arg Ala Arg Phe Asp Leu 
355 360 365 

Gin Met Leu Lys Leu Leu Ala Lys Glu Asn Pro Ser Val Ala Ala Asp 
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370 375 380 

Leu Val Asp Tyr Phe Glu He Lys Glu Asp Glu Leu Lys Val Leu Val 
385 390 395 400 

Gly Asp Lys Leu Ala Ser Glu lie Leu Lys He Leu Lys Glu Lys Lys 
405 410 415 

Lys Leu Glu Arg Lys Lys Lys Lys Glu Lys Glu Lys Leu Glu Lys Glu 
420 425 430 

Lys Lys Lys Glu Glu Lys Ala Lys Glu Lys Gin Ser Asn Leu Me lie 
435 440 445 

Gin Pro Lys Glu lie Lys Glu Glu Val Lys Ala Glu Val Glu Lys Lys 
450 455 460 

Glu Glu Val Lys Glu Lys lie Val Glu Lys Pro Lys Ala Glu Glu Val 
465 470 475 480 

Lys Glu Lys Ser Lys Thr Glu Glu Lys Glu Thr Lys Lys Asp Lys Lys 
485 490 495 

Lys Gly Lys Lys Lys Lys Glu Asp Lys Gly Lys Gin Leu Thr Leu Asp 
500 505 510 

Ala Phe Phe Lys 
515 

(2) ANGABEN ZU SEQ ID NO: 9: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 468 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: Protein 

(vi) URSPRONLICHE HERKUNFT: 

(A) ORGANISMUS: Pyrococcus horikoshii 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 9: 

Met Pro Asp Val Pro Trp He Glu Lys Tyr Arg Pro Arg Lys Leu Ser 
1.5 10 15 
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Giu lie Val Asn Gin Glu Gin Ala Leu Glu Lys Val Arg Ala Trp He 
20 25 30 

Glu Ser Trp Leu His Gly Asn Pro Pro Lys Lys Lys Ala Leu Leu Leu 
35 40 45 

Ala Gly Pro Pro Gly Ser Gly Lys Thr Thr Thr Val Tyr Ala Leu Ala 
50 55 60 

His Glu Tyr Asn Phe Glu Val lie Glu Leu Asn Ala Ser Asp Glu Arg 
65 70 75 80 

Thr Tyr Asn Lys He Ala Arg Tyr Val Gin Ala Ala Tyr Thr Met Asp 
85 90 95 

He Met Gly Lys Arg Arg Lys He lie Phe Leu Asp Glu Ala Asp Asn 
100 105 110 

He Glu Pro Ser Gly Ala Pro Glu lie Ala Lys Leu lie Asp Lys Ala 
115 120 125 

Arg Asn Pro lie lie Met Ala Ala Asn His Tyr Trp Glu Val Pro Lys 
130 135 140 

Glu He Arg Asp Arg Ala Glu Leu Val Glu Tyr Lys Arg Leu Asn Gin 
145 ~ 150. 155 160 

Arg Asp Val lie Ser Ala Leu Val Arg lie Leu Lys Arg Glu Gly He 
165 170 ~ 175 

Thr Val Pro Lys Glu lie Leu Thr Glu lie Ala Lys Arg Ser Ser Gly 
180 185 190 

Asp Leu Arg Ala Ala He Asn Asp Leu Gin Thr He Val Ala Gly Gly 
195 200 205 

Tyr Glu Asp Ala Lys Tyr Val Leu Ala Tyr Arg Asp Val Glu Lys Thr 
210 215 220 

Val Phe Gin Ser Leu Gly Met Val Phe Ser Ser Asp Asn Ala Lys Arg 
225 230 235 240 

Ala Lys Leu Ala Leu Met Asn Leu Asp Met Ser Pro Asp Glu Phe Leu 
245 250 255 

Leu Trp Val Asp Glu Asn He Pro His Met Tyr Leu Lys Pro Glu Glu 
260 265 270 

Met Ala Arg Ala Tyr Glu Ala lie Ser Arg Ala Asp He Tyr Leu Gly 
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275 280 285 

Arg Ala Gin Arg Thr Gly Asn Tyr Ser Leu Trp Lys Tyr Ala He Asp 
^90 295 300 

Met Met Thr Ala Gly Va. Ala Val A.a Gly Thr Lys Lys Lys Gly Phe 
JUtJ 310 315 320 

Ala Lys Phe Tyr Pro Pro Asn Thr Leu Lys Met Leu Ala Glu Ser Lys 
325 330 335 

Glu Glu Arg Ser lie Arg Asp Ser lie lie Lys Lys lie Met Lys Glu 
d40 345 350 

Met His Met Ser Lys Leu Glu A.a Leu Glu Thr Met Lys lie Leu Arg 
360 365 M 

Thr lie Phe Glu Asn Asn Leu Asp Leu Ala Ala His Phe Thr Val Phe 
J/u 375 380 

Leu Glu Leu Thr Glu Lys Glu Val Glu Phe Leu Ala Gly Lys Glu Lys 
390 395 400 

Ala Gly Thr lie Trp Gly Lys Thr Leu Ser lie Arg Arg Arg He Lys 
405 410 415 Y 

« 

Glu Thr Glu Lys He Glu Glu Lys Ala Val Glu Glu Lys Val Glu Glu 
420 425 430 

Glu Glu Ala Glu Glu Glu Glu Glu Glu Glu Arg Lys Glu Glu Glu Lys 
43 b 440 445 r 

Pro Lys Ala Glu Lys Lys Lys Gly Lys Gin Val Thr Leu Phe Asp Phe 
450 455 460 

He Lys Lys Asn 
465 

(2) ANGABEN ZU SEQ ID NO: 10: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 479 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 
(vi) URSPRUNLICHE HERKUNFT: 
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(A) ORGANISMUS: Methanobacterium thermoautotrrophicum 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 10: 

Met Ser Trp Thr Glu Lys Tyr Arg Pro Gly Ser Phe Asp Glu Val Val 
1 5 10 15 

Gly Asn Gin Lys Val lie Ala Glu He Lys Glu Trp He Lys Ala Trp 
20 25 30 

Lys Ala Gly Lys Pro Gin Lys Pro Leu Leu Leu Val Gly Pro Pro Gly 
35 40 45 

Thr Gly Lys Thr Thr Leu Ala His He He Gly Lys Glu Phe Ser Asp 
50 55 60 

Thr Leu Glu Leu Asn Ala Ser Asp Arg Arg Ser Gin Asp Ala Leu Met 
55 70 75 80 

Arg Ser Ala Gly Glu Ala Ser Ala Thr Arg Ser Leu Phe Asn His Asp 
85 90 95 

Leu Lys Leu He lie Leu Asp Glu Val Asp Gly lie His Gly Asn Glu 
100 . 105 no 

Asp Arg Gly Gly Val Gin Ala He Asn Arg lie lie Lys Glu Ser Arq 
115 120 125 

His Pro Met Val Leu Thr Ala Asn Asp Pro Tyr Ser Lys Arg Leu Gin 
130 135 140 

Ser lie Lys Pro Arg Cys Arg Val Leu Asn Leu Arg Lys Val His Thr 
145 150 155 160 

Ser Ser He Ala Ala Ala Leu Arg Arg lie Cys Arg Ala Glu Gly He 
165 170 175 

Glu Cys Pro Asp Asp Val Leu Arg Glu Leu Ala Lys Arg Ser Arg Glv 
180 185 190 

Asp Leu Arg Ser Ala lie Asn Asp Leu Glu Ala Met Ala Glu Gly Glu 
195 200 205 

Glu Arg He Gly Glu Glu Leu Leu Lys Met Gly Glu Lys Asp Ala Thr 
210 215 220 

Ser Asn Leu Phe Asp Ala Val Arg Ala Val Leu Lys Ser Arg Asp Val 
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240 



Ser Lys Val Arg Glu Ala Met Arg Val Asp Asp Asp Pro Thr Leu Val 
245 250 255 

Leu Glu Phe lie Ala Glu Asn Val Pro Arg Glu Tyr Glu Lys Pro Asn 
260 265 270 

Glu He Ser Arg Ala Tyr Asp Met Leu Ser Arg Ala Asp lie Phe Phe 
275 280 285 ~ 

Gly Arg Ala Val Arg Thr Arg Asn Tyr Thr Tyr Trp Arg Tyr Ala Ser 
290 295 300 

Glu Leu Met Gly Pro Gly Val Ala Leu Ala Lys Asp Lys Thr Tyr Arq 
305 310 315 320 

Lys Phe Val Arg Tyr Thr Gly Ser Ser Ser Phe Arg He Leu Gly Lys 
325 330 335 

Thr Arg Lys Gin Arg Ser Leu Arg Asp Ser Val Ala Ala Lys Met Ala 
340 345 350 

Gly Lys Met His He Ser Pro Lys Val Ala He Ser Met Phe Pro Tyr 
355 360 365 

Met Glu lie Leu Phe Glu Asn Asp Glu Met Ala Tyr Asp lie Ser Glu 
370 375 380 

Phe Leu Glu Leu Arg Asp Glu Glu He Lys Leu Phe Arg Lys Arg Lys 
385 390 395 400 

He Lys Ala Pro Lys Arg Lys Lys Thr Pro Arg Lys Ala Glu He Lys 
405 410 415 

Val Gly Pro Leu Tyr Ser Gin Lys Lys Asp Lys Gly Ala Asp Lys Ser 
420 425 430 

He Asn Asp Lys Ala Thr Asp Lys Ser Ala Lys Thr Pro He Lys Ser 
435 440 445 

Ser Lys Lys Asp Asp Arg Pro Arg Asp Glu Ser Ser Ser Ser Ser Asp 
455 460 

Asp Lys Lys Pro Lys Glu Lys Gin Thr Ser Leu Phe Gin Phe Ser 
465 470 475 

(2) ANGABEN ZU SEQ ID NO: 11: 
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(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 261 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: Protein 

(vi) URSPRUNLICHE HERKUNFT: 

(A) ORGAN1SMUS: Homo sapiens 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 11: 

Met Phe Glu Ala Arg Leu Val Gin Gly Ser lie Leu Lys Lys Val Leu 
1 5 10 15 

Glu Ala Leu Lys Asp Leu lie Asn Glu Ala Cys Trp Asp lie Ser Ser 
20 25 30 

Ser Gly Val Asn Leu Gin Ser Met Asp Ser Ser His Val Ser Leu Val 
35 40 45 

Gin Leu Thr Leu Arg Ser Glu Gly Phe Asp Thr Tyr Arg Cys Asp Arg 
50 55 60 

Asn Leu Ala Met Gly Val Asn Leu Thr Ser Met Ser Lys lie Leu Lys 
65 70 75 80 

Cys Ala Gly Asn Glu Asp lie lie Thr Leu Arg Ala Glu Asp Asn Ala 
85 90 95 

Asp Thr Leu Ala Leu Val Phe Glu Ala Pro Asn Gin Glu Lys Val Ser 
100 105 no 

Asp Tyr Glu Met Lys Leu Met Asp Leu Asp Val Glu Gin Leu Gly He 
115 120 125 

Pro Glu Gin Glu Tyr Ser Cys Val Val Lys Met Pro Ser Gly Glu Phe 
130 135 140 

Ala Arg He Cys Arg Asp Leu Ser His He Gly Asp Ala Val Val He 
145 150 155 160 

Ser Cys Ala Lys Asp Gly Val Lys Phe Ser Ala Ser Gly Glu Leu Gly 
165 170 175 

Asn Gly Asn He Lys Leu Ser Gin Thr Ser Asn Val Asp Lys Glu Glu 
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180 18 5 190 

Glu Ala Val Thr He Glu Met Asn Glu Pro Val Gin Leu Thr Phe Ala 
1 95 200 205 

Leu Arg Tyr Leu Asn Phe Phe Thr Lys Ala Thr Pro Leu Ser Ser Thr 
^10 215 ?*>n 



ValThr Leu Ser Met Ser Ala Asp Val Pro Leu Val Val Glu Tyr Lys 



235 240 



He Ala Asp Met Gly His Leu Lys Tyr Tyr Leu Ala Pro Lys He Glu 



245 250 



255 



Asp Glu Glu Gly Ser 
260 

(2) ANGABEN ZU SEQ ID NO: 12: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 245 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(vi) URSPRONLICHE HERKUNFT: 

(A) ORGANISMUS: Archaeoglobus fulgidus 



<xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 12: 

Met lie Asp Val He Met Thr Gly Glu Leu Leu Lys Thr Val Thr Arc 
1 5 10 15 

Ala lie Val Ala Leu Val Ser Glu Ala Arg He His Phe Leu Glu Lys 
20 25 30 

Gly Leu His Ser Arg Ala Val Asp Pro Ala Asn Val Ala Met Val He 
35 40 45 

Val Asp He Pro Lys Asp Ser Phe Glu Val Tyr Asn He Asp Glu Glu 
5,0 55 60 

Lys Thr He Gly Val Asp Met Asp Arg He Phe Asp He Ser Lys Ser 
OS 70 75 so 
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He Ser Thr Lys Asp Leu Val Glu Leu lie Val Glu Asp Glu Ser Thr 
85 go 95 

Leu Lys Val Lys Phe Gly Ser Val Glu Tyr Lys Val Ala Leu He Asp 
100 10 5 110 

Pro Ser Ala He Arg Lys Glu Pro Arg He Pro Glu Leu Glu Leu Pro 
1 1 5 120 12 5 

Ala Lys He Val Met Asp Ala Gly Glu Phe Lys Lys Ala He Ala Ala 
1JU 1 35 140 

Ala A SP Lys He Ser Asp Gin Val lie Phe Arg Ser Asp Lys Glu Gly 
145 150 155 160 

Phe Arg lie Glu Ala Lys Gly Asp Val Asp Ser He Val Phe His Met 
165 170 i 75 

Thr Glu Thr Glu Leu He Glu Phe Asn Gly Gly Glu Ala Arg Ser Met 
180 185 igo 

Phe Ser Val Asp Tyr Leu Lys Glu Phe Cys Lys Val Ala Gly Ser Gly 
i»t) 200 205 

Asp Leu Leu Thr He His Leu Gly Thr Asn Tyr Pro Val Arg Leu Val 
215. 220 

Phe Glu Leu Val Gly Gly Arg Ala Lys Val Glu Tyr He Leu Ala Pro 
230 235 240 

Arg He Glu Ser Glu 
245 

(2) ANGABEN ZU SEQ ID NO: 13: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 247 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: Protein 

(vi) URSPRUNLICHE HERKUNFT- 

(A) ORGANISMUS: Methanococcus jannaschii 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 13: 
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Met Phe Arg Gly Val Met Glu Ser Ala Lys Glu Phe Lys Lys Val Val 
1 5 10 15 

Asp Thr lie Ser Thr Leu Leu Asp Glu He Cys Phe Glu Val Asp Glu 
20 25 30 

Glu Gly He Lys Ala Ser Ala Met Asp Pro Ser His Val Ala Leu Val 
35 40 45 

Ser Leu Glu lie Pro Arg Leu Ala Phe Glu Glu Tyr Glu Ala Asp Ser 
50 55 60 

His Asp lie Gly lie Asp Leu Glu Ala Phe Lys Lys Val Met Asn Arg 
65 70 75 80 

Ala Lys Ala Lys Asp Arg Leu He Leu Glu Leu Asp Glu Glu Lys Asn 
85 go 95 

Lys Leu Asn Val He Phe Glu Asn Thr Gly Lys Arg Lys Phe Ser Leu 

ioo 105 no 

Ala Leu Leu Asp He Ser Ala Ser Ser Val Lys Val Pro Glu He Glu 
115 120 125 

Tyr Pro Asn Val lie Met lie Lys Gly Asp Ala Phe Lys Glu Ala Leu 
130 135 140 

Lys Asp Ala Asp Leu Phe Ser Asp Tyr Val He Leu Lys Ala Asp Glu 
145 150 155 160 

Asp Lys Phe Val He His Ala Lys Gly Asp Leu Asn Glu Asn Glu Ala 
165 170 175 

He Phe Glu Lys Asp Ser Ser Ala lie lie Ser Leu Glu Val Lys Glu 
180 185 190 

Glu Ala Lys Ser Ala Phe Asn Leu Asp Tyr Leu Met Asp Met Val Lys 
195 200 205 

Gly Val Ser Ser Gly Asp He He Lys lie Tyr Leu Gly Asn Asp Met 
210 215 220 

Pro Leu Lys Leu Glu Tyr Ser lie Ala Gly Val Asn Leu Thr Phe Leu 
225 230 235 240 

Leu Ala Pro Arg He Glu Gly 
245 

(2) ANGABEN ZU SEQ ID NO: 14: 
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(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 249 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(vi) URSPROnLICHE HERKUNFT: 

(A) ORGANISMUS: Pyrococcus horikoshii 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 14: 

Met Pro Phe Glu lie Val Phe Glu Gly Ala Lys Glu Phe Ala Gin Leu 
1 5 10 15 

He Glu Thr Ala Ser Arg Leu lie Asp Glu Ala Ala Phe Lys Val Thr 
20 25 30 

Glu Glu Gly He Ser Met Arg Ala Met Asp Pro Ser Arg Val Val Leu 
35 40 45 

He Asp Leu Asn Leu Pro Ser Ser He Phe Ser Lys Tyr Glu Val Asp 
50 55 60 

Gly Glu Glu Thr He Gly Val Asn Met Asp His Leu Lys Lys Val Leu 
65 7 0 75 80 

Lys Arg Gly Lys Ala Lys Asp Thr Leu He Leu Arg Lys Gly Glu Glu 
85 90 95 

Asn Phe Leu Glu lie Ser Leu Gin Gly Thr Ala Thr Arg Thr Phe Arg 
100 105 110 

Leu Pro Leu lie Asp Val Glu Glu He Glu Val Glu Leu Pro Asp Leu 
115 120 125 

Pro Tyr Thr Ala Lys Val Val Val Leu Gly Glu Val Leu Lys Glu Ala 
130 135 140 

Val Lys Asp Ala Ser Leu Val Ser Asp Ser He Lys Phe Met Ala Lys 
145 150 155 160 

Glu Asn Glu Phe He Met Arg Ala Glu Gly Glu Thr Gin Glu Val Glu 
165 170 175 

Val Lys Leu Thr Leu Glu Asp Glu Gly Leu Leu Asp lie Glu Val Gin 
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180 185 190 

Glu Glu Thr Lys Ser Ala Tyr Gly Val Ser Tyr Leu Ala Asp Met Val 
195 200 205 

Lys Gly lie Gly Lys Ala Asp Glu Val Thr Met Arg Phe Gly Asn Glu 
210 215 220 

Met Pro Met Gin Met Glu Tyr Tyr He Arg Asp Glu Gly Arg Leu Thr 
225 230 235 240 

Phe Leu Leu Ala Pro Arg Val Glu Glu 
245 

(2) ANGABEN ZU SEQ ID NO: 15: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 244 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: Protein 

(vi) URSPRUNLICHE HERKUNFT: 

(A) ORGANISMUS: Methanobacterium thermoautotrophicum 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 15: 

Met Phe Lys Ala Glu Leu Asn Asp Pro Asn He Leu Arg Thr Ser Phe 
1 5 10 15 

Asp Ala lie Ser Ser He Val Asp Glu Val Gin lie Gin Leu Ser Ala 
20 25 30 

Glu Gly Leu Arg Leu Asp Ala Leu Asp Arg Ser His He Thr Tyr Val 
35 40 45 

His Leu Glu Leu Lys Ala Glu Leu Phe Asp Glu Tyr Val Cys Asp Glu 
50 55 60 

Pro Glu Arg He Asn Val Asp Thr Glu Glu Leu Met Lys Val Leu Lys 
65 70 75 80 

Arg Ala Lys Ala Asn Asp Arg Val He Leu Ser Thr Asp Glu Gly Asn 
85 90 95 



ERSATZBLATT (REGEL 26) 



WO 00/08164 



- 37 - 



PCT/DE99/02480 

i 



Leu lie He Gin Phe GIu Giy Giu Ala Val Arg Thr Phe Lys lie Arg 
100 105 110 

Leu lie Asp He GIu Tyr GIu Thr Pro Ser Pro Pro GIu He GIu Tyr 
115 120 125 

GIu Asn GIu Phe GIu Val Pro Phe Gin Leu Leu Lys Asp Ser lie Ala 
130 135 140 

Asp lie Asp lie Phe Ser Asp Lys lie Thr Phe Arg Val Asp GIu Asp 
145 150 . 155 160 

Arg Phe lie Ala Ser Ala GIu Gly GIu Phe Gly Asp Ala Gin He GIu 
165 170 175 

Tyr Leu His Gly GIu Arg lie Asp Lys Pro Ala Arg Ser lie Tyr Ser 
180 185 190 

Leu Asp Lys lie Lys GIu Met Leu Lys Ala Asp Lys Phe Ser GIu Thr 
1 95 200 205 

Ala lie He Asn Leu Gly Asp Asp Met Pro Leu Lys Leu Thr Leu Lys 
210 215 220 

Met Ala Ser Lys GIu Gly GIu Leu Ser Phe Leu Leu Ala Pro Arg lie 
225 230 235 240 

GIu Ala GIu GIu 



(2) ANGABEN ZU SEQ ID NO: 16: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 469 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOG1E: linear 

(ii) ART DES MOLEKULS: Protein 

(vi) URSPRUNLICHE HERKUNFT: 

(A) ORGANISMUS: Homo sapiens 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 16: 

Met Phe Ser GIu Gin Ala Ala Gin Arg Ala His Thr Leu Leu Ser Pro 
15 10 15 
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Pro Ser Ala Asn Asn Ala Thr Phe Ala Arg Val Pro Val Ala Thr Tyr 



25 



30 



Thr Asn Ser Ser Gin Pro Phe Arg Leu Gly Glu Arg Ser Phe Ser Arg 
35 40 45 



Gin Tyr Ala His lie Tyr Ala Thr Arg Leu He Gin Met Arg Pro Phe 
su 55 60 

Leu Glu Asn Arg Ala Gin Gin His Trp Gly Ser GlyVal Gly Val Lys 

Lys Leu Cys Glu Leu Gin Pro Glu Glu Lys Cys Cys Val Val Gly Thr 
85 90 95 

Leu Phe Lys Ala Met Pro Leu Gin Pro Ser He Leu Arg Glu Val Ser 



105 



110 



Glu Glu His Asn Leu Leu Pro Gin Pro Pro Arg Ser Lys Tyr He His 
115 120 125 

Pro Asp Asp Glu Leu Val Leu Glu Asp Glu Leu Gin Arg lie Lys Leu 
135 140 

Lys Gly Thr lie Asp Val Ser Lys Leu Val Thr Gly Thr Val Leu Ala 
145 150 • 155 i 6 o 

Val Phe Gly Ser Val Arg Asp Asp Gly Lys Phe Leu Val Glu Asp Tyr 
165 170 175 

Cys Phe Ala Asp Leu Ala Pro Gin Lys Pro Ala Pro Pro Leu Asp Thr 
180 185 190 

Asp Arg Phe Val Leu LeuVal Ser Gly Leu Gly Leu Gly Gly Gly Gly 

205 

Gly Glu Ser Leu Leu Gly Thr Gin Leu Leu Val Asp Val Val Thr Gly 
215 220 

Gin Leu Gly Asp Glu Gly Glu Gin Cys Ser Ala Ala His Val Ser Arg 



240 



Val He Leu AI^Gly Asn Leu Leu Ser His Ser ThrGIn Ser Arg Asp 



250 



255 



Ser He Asn Lys Ala Lys Tyr Leu Thr Lys Lys Thr Gin Ala Ala Ser 



270 



Val Glu Ala Val Lys Met Leu Asp Glu lie Leu Leu Gin Leu Ser 



Ala 
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275 280 285 

Ser Val Pro Val Asp Val Met Pro Gly Glu Phe Asp Pro Thr Asn Tyr 
290 295 300 

Thr Leu Pro Gin Gin Pro Leu His Pro Cys Met Phe Pro Leu Ala Thr 
305 310 315 320 

Ala Tyr Ser Thr Leu Gin Leu Val Thr Asn Pro Tyr Gin Ala Thr lie 
325 330 335 

Asp Gly Val Arg Phe Leu Gly Thr Ser Gly Gin Asn Val Ser Asp lie 
340 345 350 

Phe Arg Tyr Ser Ser Met Glu Asp His Leu Glu lie Leu Glu Trp Thr 
355 360 365 

Leu Arg Val Arg His lie Ser Pro Thr Ala Pro Asp Thr Leu Gly Cys 
370 375 380 

Tyr Pro Phe Tyr Lys Thr Asp Pro Phe He Phe Pro Glu Cys Pro His 
385 390 395 400 

Val Tyr Phe Cys Gly Asn Thr Pro Ser Phe Gly Ser Lys lie lie Arg 
405 410 415 

Gly Pro Giu Asp Gin Thr Val Leu Leu Val Thr Val Pro Asp Phe Ser 
420 425 430 

Ala Thr Gin Thr Ala Cys Leu Val Asn Leu Arg Ser Leu Ala Cys Gin 
435 440 445 

Pro lie Ser Phe Ser Gly Phe Gly Ala Glu Asp Asp Asp Leu Gly Gly 
450 455 , 460 

Leu Gly Leu Gly Pro 
465 

(2) ANGABEN ZU SEQ ID NO: 17: 

(i) SEQUENZKENNZEICHEN: 

{A) LANGE: 488 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 
{vi) URSPRUNLICHE HERKUNFT: 
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(A) ORGANISMUS: Archaeoglobus fulgidus 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 17: 

Met Val lie Lys Asn lie Asp Ala Ala Thr Val Ala Lys Lys Phe Leu 
1 5 10 15 . 

Val /.rg Gly Tyr Asn He Asp Pro Lys Ala Ala Glu Leu lie Cys Lys 
20 25 30 

Ser Gly Leu Phe Ser Asp Glu Leu Val Asp Lys lie Cys Arg He Ala 
35 40. 45 

Asn Gly Gly Phe lie lie Glu Lys Ser Val Val Glu Glu Phe Leu Arg 
50 55 60 

Asn Leu Ser Asn Leu Lys Pro Ala Thr Leu Thr Pro Arg Pro Glu Glu 
65 70 75 80 

Arg Lys Val Glu Glu Val Lys Ala Ser Cys He Ala Leu Lys Val He 
85 90 95 

Lys Asp lie Thr Gly Lys Ser Ser Cys Gin Gly Asn Val Glu Asp Phe 
100 105 110 

Leu Met Tyr Phe Asn Ser Arg Leu Glu Lys Leu Ser Arg He He Arg 
115 120 125 

Ser Arg Val Asn Thr Thr Pro lie Ala His Ala Gly Lys Val Arg Gly 
130 135 140 

Asn Val Ser Val Val Gly Met Val Asn Glu Val Tyr Glu Arg Gly Asp 
145 150 155 160 

Lys Cys Tyr He Arg Leu Glu Asp Thr Thr Gly Thr He Thr Cys Val 
165 170 175 

Ala Thr Gly Lys Asn Ala Glu Val Ala Arg Glu Leu Leu Gly Asp Glu 
180 185 190 

Val lie Gly Val Thr Gly Leu Leu Lys Gly Ser Ser Leu Tyr Ala Asn 
195 200 205 

Arg He Val Phe Pro Asp Val Pro He Asn Gly Asn Gly Glu Lys Lys 
210 215 220 

Arg Asp Phe Tyr lie Val Phe Leu Ser Asp Thr His Phe Gly Ser Lys 
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225 



230 



235 



240 



Glu Phe Leu Glu Lys Glu Trp Glu Met Phe Val Arg Trp Leu Lys Gly 
245 250 255 

Glu Val Gly Gly Lys Lys Ser Gin Asn Leu Ala Glu Lys Val Lys Tyr 
260 265 270 

lie Val lie Ala Gly Asp lie Val Asp Gly He Gly Val Tyr Pro Gly 
275 280 285 

Gin Glu Asp Asp Leu Ala He Ser Asp He Tyr Gly Gin Tyr Glu Phe 
290 295 300 



Ala Ala Ser His Leu Asp Glu He Pro Lys Glu lie Lys He He Val 
305 310 315 320 

Ser Pro Gly Asn His Asp Ala Val Arg Gin Ala Glu Pro Gin Pro Ala 
325 330 335 

Phe Glu Gly Glu He Arg Ser Leu Phe Pro Lys Asn Val Glu His Val 
340 345 350 

Gly Asn Pro Ala Tyr Val Asp lie Glu Gly Val Lys Val Leu He Tyr 
355 360 365 

His Gly Arg Ser lie Asp Asp lie lie Ser Lys lie Pro Arg Leu Ser 
370 375 380 

Tyr Asp Glu Pro Gin Lys Val Met Glu Glu Leu Leu Lys Arg Arq His 
385 390 395 400 

Leu Ser Pro lie Tyr Gly Gly Arg Thr Pro Leu Ala Pro Glu Arg Glu 
405 410 415 

Asp Tyr Leu Val lie Glu Asp Val Pro Asp lie Leu His Cys Gly His 
420 425 430 

He His Thr Tyr Gly Thr Gly Phe Tyr Arg Gly Val Phe Met Val Asn 
435 440 445 

Ser Ser Thr Trp Gin Ala Gin Thr Glu Phe Gin Lys Lys Val Asn Leu 
450 455 460 

Asn Pro Met Pro Gly Asn Val Ala Val Tyr Arg Pro Gly Gly Glu Val 
465 470 475 



480 



lie Arg Leu Arg Phe Tyr Gly Glu 
485 
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(2) ANGABEN ZU SEQ ID NO: 18: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 594 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(vi) URSPRUNLICHE HERKUNFT: 

(A) ORGANISMUS: Methanbcoccus jannaschii 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 18: 

Met Glu lie He Asn Lys Phe Leu Asp Leu Glu Ala Leu Leu Ser Pro 
15 10 15 

Thr Val Tyr Glu Lys Leu Lys Asn Phe Asp Glu Glu Lys Leu Lys Am 
20 25 30 

Leu lie Gin Lys lie Arg Glu Phe Lys Lys Tyr Asn Asn Ala Phe lie 
35 40 45 

Leu Leu Asp Glu Lys Phe Leu Asp lie Phe Leu Gin Lys Asp Leu Asd 
50 55 60 

Glu He He Asn Giu Tyr Lys Asp Phe Asp Phe lie Phe Tyr Tyr Thr 
65 70 75 80 

Gly Glu Glu Glu Lys Glu Lys Pro Lys Glu Val Lys Lys Glu He Lys 
85 90 95 

Lys Glu Thr Glu Giu Lys He Glu Lys Glu Lys lie Glu Phe Val Lys 
100 105 110 

Lys Glu Glu Lys Glu Gin Phe lie Lys Lys Ser Asp Glu Asp Val Glu 
115 120 125 

Glu Lys Leu Lys Gin Leu lie Ser Lys Glu Glu Lys Lys Glu Asp Phe 
130 135 140 

Asp Ala Glu Arg Ala Lys Arg Tyr Glu His He Thr Lys lie Lys Glu 
145 150 155 160 

Ser Val Asn Ser Arg He Lys Trp He Ala Lys Asp He Asp Ala Val 
165 170 175 
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He Glu He Tyr Glu Asp Ser Asp Val Ser Gly Lys Ser Thr Cys Thr 
180 185 190 

Gly Thr He Glu Asp Phe Val Lys Tyr Phe Arg Asp Arg Phe Glu Arq 
195 200 205 

Leu Lys Val Phe He Glu Arg Lys Ala Gin Arg Lys Gly Tyr Pro Leu 
210 215 220 

Lys Asp lie Lys Lys Met Lys Gly Gin Lys Asp lie Phe Val Val Gly 
225 230 . 235 240 

lie Val Ser Asp Val Asp Ser Thr Arg Asn Gly Asn Leu He Val Arg 
245 250 255 

lie Glu Asp Thr Glu Asp Glu Ala Thr Leu lie Leu Pro Lys Glu Lys 
260 265 270 

lie Glu Ala Gly Lys lie Pro Asp Asp He Leu Leu Asp Glu Val He 
275 280 285 

Gly Ala He Gly Thr Val Ser Lys Ser Gly Ser Ser He Tyr Val Asp 
290 295 300 

Glu He lie Arg Pro Ala Leu Pro Pro Lys Glu Pro Lys Arg He Asp 
305 310 315 320 

Glu Glu He Tyr Met Ala Phe Leu Ser Asp He His Val Gly Ser Lys 
325 330 335 

Glu Phe Leu His Lys Glu Phe Glu Lys Phe He Arg Phe Leu Asn Gly 
340 345 350 

Asp Val Asp Asn Glu Leu Glu Glu Lys Val Val Ser Arg Leu Lys Tyr 
355 360 365 

He Cys lie Ala Gly Asp Leu Val Asp Gly Val Gly Val Tyr Pro Gly 
370 375 380 

Gin Glu Glu Asp Leu Tyr Glu Val Asp He lie Glu Gin Tyr Arg Glu 
385 390 395 400 

He Ala Met Tyr Leu Asp Gin He Pro Glu His lie Ser He He He 
405 410 415 

Ser Pro Gly Asn His Asp Ala Val Arg Pro Ala Glu Pro Gin Pro Lys 
420 425 430 

Leu Pro Glu Lys He Thr Lys Leu Phe Asn Arg Asp Asn He Tyr Phe 
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435 440 445 

Val G!y Asn Pro Cys Thr Leu Asn He His Gly Phe Asp Thr Leu Leu 
450 455 460 

Tyr His Gly Arg Ser Phe Asp Asp Leu Val Gly Gin He Arg Ala Ala 
465 470 475 480 

Ser Tyr Glu Asn Pro Val Thr lie Met Lys Glu Leu He Lys Arg Arg 
485 490 495 

Leu Leu Cys Pro Thr Tyr Gly Gly Arg Cys Pro lie Ala Pro Glu His 
500 505 510 

Lys Asp Tyr Leu Val He Asp Arg Asp He Asp lie Leu His Thr Gly 
515 520 525 

His lie His lie Asn Gly Tyr Gly lie Tyr Arg Gly Val Val Met Val 
530 535 540 

Asn Ser Gly Thr Phe Gin Glu Gin Thr Asp Phe Gin Lys Arg Met Gly 
545 550 555 560 

He Ser Pro Thr Pro Ala lie Val Pro He lie Asn Met Ala Lys Val 
565 570 575 

Gly Glu Lys Gly His Tyr Leu Glu Trp Asp Arg Gly Val Leu Glu Val 
580 585 590 

Arg Tyr 



(2) ANGABEN ZU SEQ ID NO: 19: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 622 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(vi) URSPRUNLICHE HERKUNFT: 

(A) ORGANISMUS: Pyrococcus horikoshii 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 19: 
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Met Asp Glu Phe Val Lys Gly Leu Met Lys Asn Gly Tyr Leu lie Thr 
15 10 15 

Pro Ser Ala Tyr Tyr Leu Leu Val Gly His Phe Asn Glu Gly Lys Phe 
20 25 30 

Ser Leu He Glu Leu He Lys Phe Ala Lys Ser Arg Glu Thr Phe He 
35 40 45 

He Asp Asp Glu He Ala Asn Glu Phe Leu Lys Ser He Gly Ala Glu 
50 55 60 



Val Glu Leu Pro Gin Glu lie Lys Glu Gly Tyr He Ser Thr Gly Glu 
65 70 75 80 

Gly Ser Gin Lys Val Pro Asp His Glu Glu Leu Glu Lys lie Thr Asn 
85 90 95 

Glu Ser Ser Val Glu Ser Ser lie Ser Thr Gly Glu Thr Pro Lys Thr 
100 105 110 

Glu Glu Leu Gin Pro Thr Leu Asp lie Leu Glu Glu Glu lie Gly Asd 
115 120 125 

He Glu Gly Gly Glu Ser Ser He Ser Thr Gly Asp Glu Val Pro Glu 
130 135 140 

Val Glu Asn Asn Asn Gly Gly Thr Val Val Val Phe Asp Lys Tyr Glv 
145 150 155 160 

Tyr Pro Phe Thr Tyr Val Pro Glu Glu He Glu Glu Glu Leu Glu Glu 
165 170 175 

Tyr Pro Lys Tyr Glu Asp Val Thr lie Glu He Asn Pro Asn Leu Glu 
180 185 190 

Val Val Pro lie Glu Lys Asp Tyr Glu He Lys Phe Asp Val Arg Arq 
195 200 205 

Val Lys Leu Lys Pro Pro Lys Val Lys Ser Gly Ser Gly Lys Glu Gly 
210 215 220 

Glu lie He Val Glu Ala Tyr Ala Ser Leu Phe Arg Ser Arg Leu Arq 
225 230 235 240 

Lys Leu Arg Arg lie Leu Arg Glu Asn Pro Glu Val Ser Asn Val He 
245 250 255 

Asp He Lys Lys Leu Lys Tyr Val Lys Gly Asp Glu Glu Val Thr He 
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260 



265 



270 



lie Gly Leu Val Asn Ser Lys Lys Glu Thr Ser Lys Gly Leu He Phe 
275 280 285 

Glu Val Glu Asp Gin Thr Asp Arg Val Lys Val Phe Leu Pro Lys Asp 
290 295 300 



Ser Glu Asp Tyr Arg Glu Ala Leu Lys Val Leu Pro Asp Ala Val Val 
305 310 315 320 

Ala Phe Lys Gly Val Tyr Ser Lys Arg Gly He Phe Phe Ala Asn Arg 
325 330 335 

Phe Tyr Leu Pro Asp Val Pro Leu Tyr Arg Lys Gin Lys Pro Pro Leu 
340 345 350 

Glu Glu Lys Val Tyr Ala Val Leu Thr Ser Asp He His Val Gly Ser 
355 360 365 

Lys Glu Phe Cys Glu Lys Ala Phe He Lys Phe Leu Glu Trp Leu Asn 
370 375 380 

Gly Tyr Val Glu Ser Lys Glu Glu Glu Glu He Val Ser Arg He Arq 
385 390 395 400 

Tyr Leu He lie Ala Gly Asp Val Val Asp Gly He Gly He Tyr Pro 
405 410 415 

Gly Gin Tyr Ser Asp Leu lie He Pro Asp He Phe Asp Gin Tyr Glu 
420 425 430 

Ala Leu Ala Asn Leu Leu Ser Asn Val Pro Lys His He Thr lie Phe 
435 440 445 

He Gly Pro Gly Asn His Asp Ala Ala Arg Pro Ala He Pro Gin Pro 
450 455 460 

Glu Phe Tyr Glu Glu Tyr Ala Lys Pro Leu Tyr Lys Leu Lys Asn Thr 
465 470 475 480 

Val He lie Ser Asn Pro Ala Val He Arg Leu His Gly Arg Asp Phe 
485 490 495 

Leu He Ala His Gly Arg Gly He Glu Asp Val Val Ser Phe Val Pro 
500 505 510 

Gly Leu Thr His His Lys Pro Gly Leu Pro Met Val Glu Leu Leu Lvs 
515 520 525 
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Met Arg His Leu Ala Pro Thr Phe Gly Gly Lys Val Pro lie Ala Pro 
530 535 540 

Asp Pro Glu Asp Leu Leu Val He Glu Glu Val Pro Asp Leu Val Gin 
545 550 555 560 

Met Gly His Val His Val Tyr Asp Thr Ala Val Tyr Arg Gly Val Gin 
565 570 575. 

Leu Val Asn Ser Ala Thr Trp Gin Ala Gin Thr Glu Phe Gin Lys Met 
580 585 590 

Val Asn lie Val Pro Thr Pro Gly Leu Val Pro He Val Asp Val Glu 
595 600 605 

Ser Ala Arg Val He Lys Val Leu Asp Phe Ser Arg Trp Cys 
610 615 620 

(2) ANGABEN ZU SEQ ID NO: 20: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 482 Aminosauren 

(B) ART: Aminosaure 

(C) STRANG FORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKLILS: Protein 

(vi) URSPRONLICHE HERKUNFT: 

(A) ORGANISMUS:.Methanobacterium thermoautotrophicum 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 20: 

Met Asn Glu lie He Gly Lys Phe Ala Arg Glu Gly He Leu He Glu 
15 10 15 

Asp Asn Ala Tyr Phe Arg Leu Arg Glu Met Asp Asp Pro Ala Ser Val 
20 25 30 

Ser Ser Glu Leu He Val Lys lie Lys Ser Asn Gly Gly Lys Phe Thr 
35 40 45 

Val Leu Thr Ser Glu Met Leu Asp Glu Phe Phe Glu He Asp Asn Pro 
50 55 60 

Ala Glu He Lys Ala Arg Gly Pro Leu Met Val Pro Ala Glu Arg Asp 
65 70 75 80 
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Phe Asp Phe Glu Val lie Ser Asp Thr Ser Asn Arg Ser Tyr Thr Ser 
85 90 95 

Gly Glu He Gly Asp Met lie Ala Tyr Phe Asn Ser Arg Tyr Ser Ser 
1.00 105 110 

Leu Lys Asn Leu Leu Ser Lys Arg Pro Glu Leu Lys Gly His lie Pro 
115 120 125 



lie Ala Asp Leu Arg Gly Gly Glu Asp Val Val Ser lie He Gly Met 
130 135 140 

Val Asn Asp Val Arg Asn Thr Lys Asn Asn His Arg He He Glu Leu 
145 150 155 160 

Glu Asp Asp Thr Gly Glu He Ser Val Val Val His Asn Glu Asn His 
165 170 175 

Lys Leu Phe Glu Lys Ser Glu Lys He Val Arg Asp Glu Val Val Gly 
180 185 190 

Val His Gly Thr Lys Lys Gly Arg Phe Val Val Ala Ser Glu He Phe 
1 95 200 205 

His Pro Gly Val Pro Arg He Gin Glu Lys Glu Met Asp Phe Ser Val 
210 215 220 

Ala Phe lie Ser Asp Val His He Gly Ser Gin Thr Phe Leu Glu Asp 
225 230 235 240 

Ala Phe Met Lys Phe Val Lys Trp He Asn Gly Asp Phe Gly Ser Glu 
245 250 255 

Glu Gin Arg Ser Leu Ala Ala Asp Val Lys Tyr Leu Val Val Ala Gly 
260 265 270 

Asp lie Val Asp Gly lie Gly lie Tyr Pro Gly Gin Glu Lys Glu Leu 
275 280 285 

Leu lie Arg Asp He His Glu Gin Tyr Glu Glu Ala Ala Arg Leu Phe 
290 295 300 

Gly Asp He Arg Ser Asp He Lys He Val Met lie Pro Gly Asn His 
305 310 315 320 

Asp Ser Ser Arg lie Ala Glu Pro Gin Pro Ala He Pro Glu Glu Tyr 
325 330 335 

Ala Lys Ser Leu Tyr Ser lie Arg Asn He Glu Phe Leu Ser Asn Pro 
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340 345 350 

Ser Leu Vai Ser Leu Asp Gly Val Arg Thr Leu lie Tyr His Gly Arg 
355 360 365 

Ser Phe Asp Asp Met Ala Met Ser Val Asn Gly Leu Ser His Glu Ar 
370 375 380 

Ser Asp Leu lie Met Glu Glu Leu Leu Glu Lys Arg His Leu Ala Pro 
385 390 395 400 

lie Tyr Gly Glu Arg Thr Pro Leu Ala Ser Glu lie Glu Asp His Leu 
405 410 415 

Val He Asp Glu Val Pro His Val Leu His Thr Gly His Val His lie 
420 425 430 

Asn Ala Tyr Lys Lys Tyr Lys Gly Val His Leu He Asn Ser Gly Thr 
435 440 445 

Phe Gin Ser Gin Thr Glu Phe Gin Lys He Tyr Asn He Val Pro Thr 
450 455 460 

Cys Gly Gin Val Pro Val Leu Asn Arg Gly Val Met Lys Leu Leu Glu 
465 470 475 480 

Phe Ser 



(2) ANGABEN ZU SEQ ID NO: 21: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 613 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

Hi) ART DES MOLEKOLS: Protein 

(vi) URSPRUNLICHE HERKUNFT: 

(A) ORGANISMUS: Pyrococcus furiosus 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 21: 

Met Asp Glu Phe Val Lys Ser Leu Leu Lys Ala Asn Tyr Leu He Thr 
1 5 10 15 
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Pro Ser Ala Tyr Tyr Leu Leu Arg Glu Tyr Tyr Glu Lys Gly Glu Phe 
20 25 30 

Ser lie Val Glu Leu Val Lys Phe Ala Arg Ser Arg Glu Ser Tyr He 
35 40 45 

He Thr Asp Ala Leu Ala Thr Glu Phe Leu Lys Val Lys Gly Leu Glu 
50 55 60 

Pro lie Leu Pro Val Glu Thr Lys Gly Gly Phe Val Ser Thr Gly Glu 
65 70 75 80 

Ser Gin Lys Glu Gin Ser Tyr Glu Glu Ser Phe Gly Thr Lys Glu Glu 
85 90 95 

He Ser Gin Glu He Lys Glu Gly Glu Ser Phe He Ser Thr Gly Ser 
100 105 110 

Glu Pro Leu Glu Glu Glu Leu Asn Ser He Gly He Glu Glu He Gly 
115 120 125 

Ala Asn Glu Glu Leu Val Ser Asn Gly Asn Asp Asn Gly Gly Glu Ala 
130 135 140 

He Val Phe Asp Lys Tyr Gly Tyr Pro Met Val Tyr Ala Pro Glu Glu 
145 150 • 155 160 

lie Glu Val Giu Glu Lys Glu Tyr Ser Lys Tyr Glu Asp Leu Thr He 
165 170 175 

Pro Met Asn Pro Asp Phe Asn Tyr Val Glu lie Lys Glu Asp Tyr Asp 
180 185 190 

Val Val Phe Asp Val Arg Asn Val Lys Leu Lys Pro Pro Lys Val Lys 
195 200 205 

Asn Gly Asn Gly Lys Glu Gly Glu He He Val Glu Ala Tyr Ala Ser 
210 215 220 

Leu Phe Arg Ser Arg Leu Lys Lys Leu Arg Lys He Leu Arg Glu Asn 
225 230 235 240 

Pro Glu Leu Asp Asn Val Val Asp He Gly Lys Leu Lys Tyr Val Lys 
245 250 255 

Glu Asp Glu Thr Val Thr lie He Gly Leu Val Asn Ser Lys Arg Glu 
260 265 270 

Val Asn Lys Gly Leu He Phe Glu He Glu Asp Leu Thr Gly Lys Val 
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275 



280 



285 



Lys Val Phe Leu Pro Lys Asp Ser Glu Asp Tyr Arg Glu Ala Phe Lys 
290 295 300 



Val Leu Pro Asp Ala Val Val Ala Phe Lys Gly Val Tyr Ser Lys Arg 
305 310 315 320 

Gly He Leu Tyr Ala Asn Lys Phe Tyr Leu Pro Asp Val Pro Leu Tyr 
325 330 335 

Arg Arg Gin Lys Pro Pro Leu Glu Glu Lys Val Tyr Ala lie Leu lie 
340 345 350 

Ser Asp He His Val Gly Ser Lys Glu Phe Cys Glu Asn Ala Phe He 
355 360 365 

Lys Phe Leu Glu Trp Leu Asn Gly Asn Val Glu Thr Lys Glu Glu Glu 
370 375 380 

Glu He Val Ser Arg Val Lys Tyr Leu He He Ala Gly Asp Val Val 
385 390 395 400 

Asp Gly Val Gly Val Tyr Pro Gly Gin Tyr Ala Asp Leu Thr He Pro 
405 410 415 

Asp He Phe Asp Gin Tyr Glu Ala Leu Ala Asn Leu Leu Ser His Val 
420 425 430 

Pro Lys His lie Thr Met Phe He Ala Pro Gly Asn His Asp Ala Ala 
435 440 445 

Arg Gin Ala He Pro Gin Pro Glu Phe Tyr Lys Glu Tyr Ala Lys Pro 
450 455 460 

lie Tyr Lys Leu Lys Asn Ala Val He He Ser Asn Pro Ala Val He 
465 470 475 480 

Arg Leu His Gly Arg Asp Phe Leu He Ala His Gly Arg Gly He Glu 
485 490 495 

Asp Val Val Gly Ser Val Pro Gly Leu Thr His His Lys Pro Gly Leu 
500 505 510 

Pro Met Val Glu Leu Leu Lys Met Arg His Val Ala Pro Met Phe Gly 
515 520 525 

Gly Lys Val Pro lie Ala Pro Asp Pro Glu Asp Leu Leu Val He Glu 
530 535 540 
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Glu Val Pro Asp Val Val His Met Gly His Val His Val Tyr Asp Ala 
545 550 555 560 

Val Val Tyr Arg Gly Val Gin Leu Val Asn Ser Ala Thr Trp Gin Ala 
565 570 575 

Gin Thr Glu Phe Gin Lys Met Val Asn lie Val Pro Thr Pro Ala Lys 
580 585 590 

Val Pro Val Val Asp lie Asp Thr Ala Lys Val Val Lys Val Leu Asp 
595 600 605 

Phe Ser Gly Trp Cys 
610 

(2) ANGABEN ZU SEQ ID NO: 22: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 1107 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(vi) URSPRONLICHE HERKUNFT: 

(A» ORGANISMUS: Homo sapiens 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 22: 

Met Asp Gly Lys Arg Arg Pro Gly Pro Gly Pro Gly Val Pro Pro Lys 
15 10 15 

Arg Ala Arg Gly Gly Leu Trp Asp Asp Asp Asp Ala Pro Trp Pro Ser 
20 25 30 

Gin Phe Glu Glu Asp Leu Ala Leu Met Glu Glu Met Glu Ala Glu His 
35 40 45 

Arg Leu Gin Glu Gin Glu Glu Glu Glu Leu Gin Ser Val Leu Glu Gly 
50 55 60 

Val Ala Asp Gly Gin Val Pro Pro Ser Ala lie Asp Pro Arg Trp Leu 
65 70 75 80 

Arg Pro Thr Pro Pro Ala Leu Asp Pro Gin Thr Glu Pro Leu lie Phe 
85 90 95 
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Gin Gin Leu Glu He Asp His Tyr Val Gly Pro Ala Gin Pro Val Pro 
100 105 110 

Gly Gly Pro Pro Pro Ser Arg Gly Ser Val Pro Val Leu Arg Ala Phe 
115 120 125 

Gly Val Thr Asp Glu Gly Phe Ser Val Cys Cys His lie His Gly Phe 
130 135 140 

Ala Pro Tyr Phe Tyr Thr Pro Ala Pro Pro Gly Phe Gly Pro Glu His 
145 150 155 160 

Met Gly Asp Leu Gin Arg Glu Leu Asn Leu Ala lie Ser Arg Asp Ser 
165 170 175 

Arg Gly Gly Arg Glu Leu Thr Gly Pro Ala Val Leu Ala Val Glu Leu 
180 185 190 

Cys Ser Arg Glu Ser Met Phe Gly Tyr His Gly His Gly Pro Ser Pro 
1 95 200 205 

Phe Leu Arg He Thr Val Ala Leu Pro Arg Leu Val Ala Pro Ala Arg 
210 215 220 

Arg Leu Leu Glu Gin Gly lie Arg Val Ala Gly Leu Gly Thr Pro Ser 
225 230 235 240 

Phe Ala Pro Tyr Glu Ala Asn Val Asp Phe Glu He Arg Phe Met Val 
245 250 255 

Asp Thr Asp He Val Gly Cys Asn Trp Leu Glu Leu Pro Ala Gly Lys 
260 265 270 

Tyr Ala Leu Arg Leu Lys Glu Lys Ala Thr Gin Cys Gin Leu Glu Ala 
275 280 285 

Asp Val Leu Trp Ser Asp Val Val Ser His Pro Pro Glu Gly Pro Trp 
290 295 300 

Gin Arg lie Ala Pro Leu Arg Val Leu Ser Phe Asp He Glu Cys Ala 
305 310 315 320 

Gly Arg Lys Gly He Phe Pro Glu Pro Glu Arg Asp Pro Val He Gin 
325 330 335 

He Cys Ser Leu Gly Leu Arg Trp Gly Glu Pro Glu Pro Phe Leu Arg 
340 345 350 

Leu Ala Leu Thr Leu Arg Pro Cys Ala Pro lie Leu Gly Ala Lys Val 
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355 



360 



365 



Gin Ser Tyr Glu Lys Glu Glu Asp Leu Leu Gin Ala Trp Ser Thr Phe 
370 375 380 

lie Arg lie Met Asp Pro Asp Val lie Thr Gly Tyr Asn lie Gin Asn 
385 390 395 400 

Phe Asp Leu Pro Tyr Leu He Ser Arg Ala Gin Thr Leu Lys Val Gin 
405 410 415 

Thr Phe Pro Phe Leu Gly Arg Val Ala Gly Leu Cys Ser Asn lie Arq 
420 425 430 

Asp Ser Ser Phe Gin Ser Lys Gin Thr Gly Arg Arg Asp Thr Lvs Val 
435 440 445 

Val Ser Met Val Gly Arg Val Gin Met Asp Met Leu Gin Val Leu Leu 
450 455 460 

Arg Glu Tyr Lys Leu Arg Ser His Thr Leu Asn Ala Val Ser Phe His 
465 470 475 480 

Phe Leu Gly Glu Gin Lys Glu Asp Val Gin His Ser lie lie Thr Asp 
485 490 495 

Leu Gin Asn Gly Asn Asp Gin Thr Arg Arg Arg Leu Ala Val Tyr Cvs 
500 505 510 

Leu Lys Asp Ala Tyr Leu Pro Leu Arg Leu Leu Glu Arg Leu Met Val 
515 520 525 

Leu Val Asn Ala Val Glu Met Ala Arg Val Thr Gly Val Pro Leu Ser 
530 535 540 

Tyr Leu Leu Ser Arg Gly Gin Gin Val Lys Val Val Ser Gin Leu Leu 
545 550 555 560 

Arg Gin Ala Met His Glu Gly Leu Leu Met Pro Val Val Lys Ser Glu 
565 570 575 

Gly Gly Glu Asp Tyr Thr Gly Ala Thr Val ile Glu Pro Leu Lys Gly 
580 585 590 

Tyr Tyr Asp Val Pro Ile Ala Thr Leu Asp Phe Ser Ser Leu Tyr Pro 
595 600 605 

Ser lie Met Met Ala His Asn Leu Cys Tyr Thr Thr Leu Leu Arg Pro 
610 615 620 
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Gly Thr Ala Gin Lys Leu Gly Leu Thr Glu Asp Gin Phe He Arg Thr 
625 630 635 640 

Pro Thr Gly Asp Glu Phe Val Lys Thr Ser Val Arg Lys Gly Leu Leu 
645 650 655 

Pro Gin lie Leu Glu Asn Leu Leu Ser Ala Arg Lys Arg Ala Lys Ala 
660 665 670 

Glu Leu Ala Lys Glu Thr Asp Pro Leu Arg Arg Gin Val Leu Asp Gly 
675 680 685 

Arg Gin Leu Ala Leu Lys Val Ser Ala Asn Ser Val Tyr Gly Phe Thr 
690 695 700 

Gly Ala Gin Val Giy Lys Leu Pro Cys Leu Glu He Ser Gin Ser Val 
705 710 715 720 

Thr Gly Phe Gly Arg Gin Met lie Glu Lys Thr Lys Gin Leu Val Glu 
725 730 735 

Ser Lys Tyr Thr Val Glu Asn Gly Tyr Ser Thr Ser Ala Lys Val Val 
740 745 750 

Tyr Gly Asp Thr Asp Ser Val Met Cys Arg Phe Gly Val Ser Ser Val 
755 760 765 

Ala Glu Ala Met Ala Leu Gly Arg Glu Ala Ala Asp Trp Val Ser Gly 
770 775 780 

His Phe Pro Ser Pro lie Arg Leu Glu Phe Glu Lys Val Tyr Phe Pro 
785 790 795 800 

Tyr Leu Leu lie Ser Lys Lys Arg Tyr Ala Gly Leu Leu Phe Ser Ser 
805 810 815 

Arg Pro Asp Ala His Asp Arg Met Asp Cys Lys Gly Leu Glu Ala Val 
820 825 830 

Arg Arg Asp Asn Cys Pro Leu Val Ala Asn Leu Val Thr Ala Ser Leu 
835 840 845 

Arg Arg Leu Leu He Asp Arg Asp Pro Glu Gly Ala Val Ala His Ala 
850 855 860 

Gin Asp Val He Ser Asp Leu Leu Cys Asn Arg lie Asp He Ser Gin 
865 870 875 880 

Leu Val He Thr Lys Glu Leu Thr Arg Ala Ala Ser Asp Tyr Ala Gly 
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885 890 895 

Lys Gin Ala His Val Glu Leu Ala Glu Arg Met Arg Lys Arg Asp Pro 
900 905 910 

Gly Ser Ala Pro Ser Leu Gly Asp Arg Val Pro Tyr Val He He Ser 
915 920 925 

Ala Ala Lys Gly Val Ala Ala Tyr Met Lys Ser Glu Asp Pro Leu Phe 
930 935 940 

Val Leu Glu His Ser Leu Pro lie Asp Thr Gin Tyr Tyr Leu Glu Gin 
945 950 955 960 

Gin Leu Ala Lys Pro Leu Leu Arg He Phe Glu Pro He Leu Gly Glu 
965 970 975 

Gly Arg Ala Glu Ala Val Leu Leu Arg Gly Asp His Thr Arg Cys Lys 
980 985 " 990 

Thr Val Leu Thr Gly Lys Val Gly Gly Leu Leu Ala Phe Ala Lys Arg 
995 1000 1005 

Arg Asn Cys Cys He Gly Cys Arg Thr Val Leu Ser His Gin Gly Ala 
1010 1015 1020 

Val Cys Glu Phe Cys Gin Pro Arg Glu Ser Glu Leu Tyr Gin Lys Glu 
1025 1030 1035 1040 

Val Ser His Leu Asn Ala Leu Glu Glu Arg Phe Ser Arg Leu Trp Thr 
1045 1050 1055 

Gin Cys Gin Arg Cys Gin Gly Ser Leu His Glu Asp Val lie Cys Thr 
1060 1065 1070 

Ser Arg Asp Cys Pro lie Phe Tyr Met Arg Lys Lys Val Arg Lys Asp 
1075 1080 1085 

Leu Glu Asp Gin Glu Gin Leu Leu Arg Arg Phe Gly Pro Pro Gly Pro 
1090 1095 1100 

Glu Ala Trp 
1105 

(2) ANGABEN ZU SEQ ID NO: 23: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 781 Aminosauren 

(B) ART: Aminosaure 
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(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEK0LS: Protein 

(vi) URSPRUNLICHE HERKUNFT: 

(A) ORGANISMUS: Archaeoglobus fulgidus 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 23: 

Met Glu Arg Val Glu Giy Trp Leu lie Asp Ala Asp Tyr Glu Thr lie 
1 5 10 15 

Gly Gly Lys Ala Val Val Arg Leu Trp Cys Lys Asp Asp Gin Gly He 
20 25 30 

Phe Val Ala Tyr Asp Tyr Asn Phe Asp Pro Tyr Phe Tyr Val He Gly 
35 40 45 

Val Asp Glu Asp lie Leu Lys Asn Ala Ala Thr Ser Thr Arg Arg Glu 
50 55 60 

Val lie Lys Leu Lys Ser Phe Glu Lys Ala Gin Leu Lys Thr Leu Gly 
65 70 75 80 

Arg Glu Val Glu Gly Tyr He Val Tyr Ala His His Pro Gin His Val 
85 90 95 

Pro Lys Leu Arg Asp Tyr Leu Ser Gin Phe Gly Asp Val Arg Glu Ala 
100 105 110 

Asp He Pro Phe Ala Tyr Arg Tyr Leu He Asp Lys Asp Leu Ala Cys 
115 120 125 

Met Asp Gly lie Ala lie Glu Gly Glu Lys Gin Gly Gly Val He Arg 
130 135 140 

Ser Tyr Lys He Glu Lys Val Glu Arg He Pro Arg Met Glu Phe Pro 
145 150 155 160 

Glu Leu Lys Met Leu Val Phe Asp Cys Glu Met Leu Ser Ser Phe Gly 
165 170 175 

Met Pro Glu Pro Glu Lys Asp Pro lie He Val He Ser Val Lys Thr 
180 185 190 

Asn Asp Asp Asp Glu He lie Leu Thr Gly Asp Glu Arg Lys lie lie 
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195 200 205 

Ser Asp Phe Val Lys Leu lie Lys Ser Tyr Asp Pro Asp He He Val 
210 215 220 

Gly Tyr Asn Gin Asp Ala Phe Asp Trp Pro Tyr Leu Arg Lys Arg Ala 
225 230 235 240 

Glu Arg Trp Asn He Pro Leu Asp Val Gly Arg Asp Gly Ser Asn Val 
245 250 255 

Val Phe Arg Gly Gly Arg Pro Lys He Thr Gly Arg Leu Asn Val Asp 
260 265 270 

Leu Tyr Asp He Ala Met Arg He Ser Asp He Lys lie Lys Lys Leu 
275 280 285 

Glu Asn Val Ala Glu Phe Leu Gly Thr Lys He Glu lie Ala Asp He 
290 295 300 

Glu Ala Lys Asp lie Tyr Arg Tyr Trp Ser Arg Gly Glu Lys Glu Lys 
305 310 315 320 

Val Leu Asn Tyr Ala Arg Gin Asp Ala He Asn Thr Tyr Leu He Ala 
325 330 335 

Lys Glu Leu Leu Pro Met His Tyr Glu Leu Ser Lys Met He Arg Leu 
340 345 350 

Pro Val Asp Asp Val Thr Arg Met Gly Arg Gly Lys Gin Val Asp Trp 
355 360 365 

Leu Leu Leu Ser Glu Ala Lys Lys lie Gly Glu lie Ala Pro Asn Pro 
370 375 380 

Pro Glu His Ala Glu Ser Tyr Glu Gly Ala Phe Val Leu Glu Pro Glu 
385 390 395 400 

Arg Gly Leu His Glu Asn Val Ala Cys Leu Asp Phe Ala Ser Met Tyr 
405 410 415 

Pro Ser He Met He Ala Phe Asn He Ser Pro Asp Thr Tyr Gly Cys 
420 425 430 

Arg Asp Asp Cys Tyr Glu Ala Pro Glu Val Gly His Lys Phe Arg Lys 
435 440 445 

Ser Pro Asp Gly Phe Phe Lys Arg He Leu Arg Met Leu He Glu Lys 
450 455 460 
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Arg Arg Glu Leu Lys Val Glu Leu Lys Asn Leu Ser Pro Glu Ser Ser 
465 470 475 480 

Glu Tyr Lys Leu Leu Asp He Lys Gin Gin Thr Leu Lys Val Leu Thr 
485 490 495 

Asn Ser Phe Tyr Gly Tyr Met Gly Trp Asn Leu Ala Arg Trp Tyr Cys 
500 505 510 

His Pro Cys Ala Glu Ala Thr Thr Ala Trp Gly Arg His Phe He Arg 
515 520 525 

Thr Ser Ala Lys He Ala Glu Ser Met Gly Phe Lys Val Leu Tyr Gly 
530 535 540 

Asp Thr Asp Ser He Phe Val Thr Lys Ala Gly Met Thr Lys Glu Asp 
545 550 555 560 

Val Asp Arg Leu He Asp Lys Leu His Glu Glu Leu Pro He Gin He 
565 570 575 

Glu Val Asp Glu Tyr Tyr Ser Ala lie Phe Phe Val Glu Lys Lys Arg 
580 585 590 

Tyr Ala Gly Leu Thr Glu Asp Gly Arg Leu Val Val Lys Gly Leu Glu 
595 600 605 

Val Arg Arg Gly Asp Trp Cys Glu Leu Ala Lys Lys Val Gin Arg Glu 
610 615 620 

Val He Glu Val He Leu Lys Glu Lys Asn Pro Glu Lys Ala Leu Ser 
625 630 635 640 

Leu Val Lys Asp Val lie Leu Arg He Lys Glu Gly Lys Val Ser Leu 
645 650 655 

Glu Glu Val Val He Tyr Lys Gly Leu Thr Lys Lys Pro Ser Lys Tyr 
660 665 670 

Glu Ser Met Gin Ala His Val Lys Ala Ala Leu Lys Ala Arg Glu Met 
675 680 685 

Gly He He Tyr Pro Val Ser Ser Lys He Gly Tyr Val He Val Lys 
690 695 700 

Gly Ser Gly Asn He Gly Asp Arg Ala Tyr Pro He Asp Leu He Glu 
705 710 715 720 

Asp Phe Asp Gly Glu Asn Leu Arg He Lys Thr Lys Ser Gly lie Glu 
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725 730 735 

lie Lys Lys Leu Asp Lys Asp Tyr Tyr lie Asp Asn Gin He He Pro 
740 745 750 

Ser Val Leu Arg He Leu Glu Arg Phe Gly Tyr Thr Glu Ala Ser Leu 
755 760 765 

Lys Gly Ser Ser Gin Met Ser Leu Asp Ser Phe Phe Ser 
770 775 780 

(2) ANGABEN ZU SEQ ID NO: 24: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 1 634 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(vi) URSPRUNLICHE HERKUNFT: 

(A) ORGANISMUS: Methanococcus jannaschii 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 24: 

Met Gly Met Ser Met Gly Lys lie Lys lie Asp Ala Leu He Asp Asn 
15 10 15 

Thr Tyr Lys Thr He Glu Asp Lys Ala Val He Tyr Leu Tyr Leu He 
20 25 30 

Asn Ser He Leu Lys Asp Arg Asp Phe Lys Pro Tyr Phe Tyr Val Glu 
35 40 45 

Leu His Lys Glu Lys Val Glu Asn Glu Asp He Glu Lys lie Lys Glu 
50 55 60 

Phe Leu Leu Lys Asn Asp Leu Leu Lys Phe Val Glu Asn lie Glu Val 
65 70 75 80 

Val Lys Lys lie He Leu Arg Lys Glu Lys Glu Val lie Lys He He 
85 90 95 

Ala Thr His Pro Gin Lys Val Pro Lys Leu Arg Lys He Lys Glu Cys 
100 105 110 
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Glu lie Val Lys Glu He Tyr Glu His Asp He Pro Phe Ala Lys Arg 
115 120 125 

Tyr Leu He Asp Asn Glu He He Pro Met Thr Tyr Trp Asp Phe Glu 
130 135 140 

Asn Lys Lys Pro Val Ser He Glu He Pro Lys Leu Lys Ser Val Ala 
145 150 155 160 

Phe Asp Met Glu Val Tyr Asn Arg Asp Thr Glu Pro Asn Pro Glu Arg 
165 170 175 

Asp Pro He Leu Met Ala Ser Phe Trp Asp Glu Asn Gly Gly Lys Val 
180 185 190 

lie Thr Tyr Lys Glu Phe Asn His Pro Asn lie Glu Val Val Lys Asn 
195 200 205 

Glu Lys Glu Leu He Lys Lys He He Glu Thr Leu Lys Glu Tyr Asp 
210 215 220 

Val He Tyr Thr Tyr Asn Gly Asp Asn Phe Asp Phe Pro Tyr Leu Lys 
225 230 235 240 

Ala Arg Ala Lys He Tyr Gly He Asp He Asn Leu Gly Lys Asp Gly 
245 250 255 

Glu Glu Leu Lys lie Lys Arg Gly Gly Met Glu Tyr Arg Ser Tyr He 
260 265 270 

Pro Gly Arg Val His lie Asp Leu Tyr Pro lie Ser Arg Arg Leu Leu 
275 280 285 

Lys Leu Thr Lys Tyr Thr Leu Glu Asp Val Val Tyr Asn Leu Phe Gly 
290 295 300 

He Glu Lys Leu Lys He Pro His Thr Lys lie Val Asp Tyr Trp Ala 
305 310 315 320 

Asn Asn Asp Lys Thr Leu He Glu Tyr Ser Leu Gin Asp Ala Lys Tyr 
325 330 335 

Thr Tyr Lys He Gly Lys Tyr Phe Phe Pro Leu Glu Val Met Phe Ser 
340 345 350 

Arg He Val Asn Gin Thr Pro Phe Glu lie Thr Arg Met Ser Ser Gly 
355 360 365 

Gin Met Val Glu Tyr Leu Leu Met Lys Arg Ala Phe Lys Glu Asn Met 
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370 375 380 

lie Val Pro Asn Lys Pro Asp Glu Giu Glu Tyr Arg Arg Arg Val Leu 
385 390 395 400 

Thr Thr Tyr Glu Gly Gly Tyr Val Lys Glu Pro Glu Lys Gly Met Phe 
405 410 415 

Glu Asp He He Ser Met Asp Phe Arg Cys His Pro Lys Gly Thr Lys 
420 425 430 

Val Val Val Lys Gly Lys Gly lie Val Asn lie Glu Asp Val Lys Glu 
435 440 445 

Gly Asn Tyr Val Leu Gly He Asp Gly Trp Gin Lys Val Lys Lys Val 
450 455 460 

Trp Lys Tyr Glu Tyr Glu Gly Glu Leu lie Asn Val Asn Gly Leu Lys 
465 470 475 480 

Cys Thr Pro Asn His Lys lie Pro Leu Arg Tyr Lys He Lys His Lys 
485 490 495 

Lys lie Asn Lys Asn Asp Tyr Leu Val Arg Asp He Tyr Ala Lys Ser 
500 505 510 

Leu Leu Thr Lys Phe Lys Gly Glu Gly Lys Leu He Leu Cys Lys Asp 
515 520 525 

Phe Glu Thr He Gly Asn Tyr Glu Lys Tyr He Asn Asp Met Asp Glu 
530 535 540 

Asp Phe He Leu Lys Ser Glu Leu lie Gly He Leu Leu Ala Glu Gly 
545 550 555 560 

His Leu Leu Arg Arg Asp lie Glu Tyr Phe Asp Ser Ser Arg Gly Lys 
565 570 575 

Lys Arg He Ser His Gin Tyr Arg Val Glu lie Thr Val Asn Glu Asp 
580 585 590 

Glu Lys Asp Phe He Glu Lys He Lys Tyr He Phe Lys Lys Leu Phe 
595 600 605 

Asn Tyr Glu Leu Tyr Val Arg Arg Lys Lys Gly Thr Lys Ala lie Thr 
610 615 620 

Leu Gly Cys Ala Lys Lys Asp He Tyr Leu Lys lie Glu Glu He Leu 
625 630 635 640 
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Lys Asn Lys Glu Lys Tyr Leu Pro Asn Ala He Leu Arg Gly Phe Phe 
645 650 655 

Glu Gly Asp Gly Tyr Val Asn Thr Val Arg Arg Ala Val Val Val Asn 
660 665 670 

Gin Gly Thr Asn Asn Tyr Asp Lys He Lys Phe lie Ala Ser Leu Leu 
675 680 685 

Asp Arg Leu Gly lie Lys Tyr Ser Phe Tyr Thr Tyr Ser Tyr Glu Glu 
690 695 700 

Arg Gly Lys Lys Leu Lys Arg Tyr Val lie Glu lie Phe Ser Lys Gly 
705 710 715 720 

Asp Leu lie Lys Phe Ser He Leu lie Ser Phe He Ser Arg Arg Lys 
725 730 735 

Asn Asn Leu Leu Asn Glu lie lie Arg Gin Lys Thr Leu Tyr Lys He 
740 745 750 

Gly Asp Tyr Gly Phe Tyr Asp Leu Asp Asp Val Cys Val Ser Leu Glu 
755 760 765 

Ser Tyr Lys Gly Glu Val Tyr Asp Leu Thr Leu Glu Gly Arg Pro Tyr 
770 -775 780 

Tyr Phe Ala Asn Gly He Leu Thr His Asn Ser Leu Tyr Pro Ser lie 
785 790 795 800 

lie lie Ser Tyr Asn He Ser Pro Asp Thr Leu Asp Cys Glu Cys Cys 
805 810 815 

Lys Asp Val Ser Glu Lys He Leu Gly His Trp Phe Cys Lys Lys Lys 
820 825 830 

Glu Gly Leu He Pro Lys Thr Leu Arg Asn Leu He Glu Arg Arg lie 
835 840 845 

Asn He Lys Arg Arg Met Lys Lys Met Ala Glu He Gly Glu He Asn 
850 855 860 

Glu Glu Tyr Asn Leu Leu Asp Tyr Glu Gin Lys Ser Leu Lys He Leu 
865 870 875 880 

Ala Asn Ser He Leu Pro Asp Glu Tyr Leu Thr He He Glu Glu Asp 
885 890 895 

Gly He Lys Val Val Lys lie Gly Glu Tyr He Asp Asp Leu Met Arg 
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900 905 910 

Lys His Lys Asp Lys He Lys Phe Ser Gly lie Ser Glu He Leu Glu 
915 920 925 

Thr Lys Asn Leu Lys Thr Phe Ser Phe Asp Lys lie Thr Lys Lys Cys 
930 935 940 

Glu He Lys Lys Val Lys Ala Leu lie Arg His Pro Tyr Phe Gly Lys 
945 950 955 960 

Ala Tyr Lys He Lys Leu Arg Ser Gly Arg Thr He Lys Val Thr Arg 
965 970 975 

Gly His Ser Leu Phe Lys Tyr Giu Asn Gly Lys lie Val Glu Val Lys 
980 985 990 

Gly Asp Asp Val Arg Phe Gly Asp Leu He Val Val Pro Lys Lys Leu 
995 1000 1005 

Thr Cys Val Asp Lys Glu Val Val He Asn He Pro Lys Arg Leu He 
1010 1015 1020 

Asn Ala Asp Glu Glu Giu He Lys Asp Leu Val lie Thr Lys His Lys 
1025 1030 1035 1040 

Asp Lys Ala Phe Phe Val Lys Leu Lys Lys Thr Leu Glu Asp He Glu 
1045 1050 1055 

Asn Asn Lys Leu Lys Val He Phe Asp Asp Cys He Leu Tyr Leu Lys 
1060 1065 1070 

Glu Leu Gly Leu lie Asp Tyr Asn He He Lys Lys lie Asn Lys Val 
1075 1080 1085 

Asp lie Lys He Leu Asp Glu Glu Lys Phe Lys Ala Tyr Lys Lys Tyr 
1090 1095 1100 

Phe Asp Thr Val He Glu His Gly Asn Phe Lys Lys Gly Arg Cys Asn 
1105 1110 1115 1120 

lie Gin Tyr He Lys He Lys Asp Tyr He Ala Asn He Pro Asp Lys 
1125 1130 1135 

Glu Phe Glu Asp Cys Glu He Gly Ala Tyr Ser Gly Lys He Asn Ala 
1140 1145 1150 

Leu Leu Lys Leu Asp Glu Lys Leu Ala Lys Phe Leu Gly Phe Phe Val 
1155 1160 1165 
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Thr Arg Gly Arg Leu Lys Lys Gin Lys Leu Lys Gly Glu Thr Val Tyr 
1170 1175 1180 

Glu He Ser Val Tyr Lys Ser Leu Pro Glu Tyr Gin Lys Glu He Ala 
1185 1190 1195 1200 

Glu Thr Phe Lys Glu Val Phe Gly Ala Gly Ser Met Val Lys Asp Lys 
1205 1210 1215 

Val Thr Met Asp Asn Lys He Val Tyr Leu Val Leu Lys Tyr lie Phe 
1220 1225 1230 

Lys Cys Gly Asp Lys Asp Lys Lys His He Pro Glu Glu Leu Phe Leu 
1235 1240 1245 

Ala Ser Glu Ser Val He Lys Ser Phe Leu Asp Gly Phe Leu Lys Ala 
1250 1255 1260 

Lys Lys Asn Ser His Lys Gly Thr Ser Thr Phe Met Ala Lys Asp Glu 
1265 1270 1275 1280 

Lys Tyr Leu Asn Gin Leu Met ile Leu Phe Asn Leu Val Gly lie Pro 
1285 1290 1295 

Thr Arg Phe Thr Pro Val Lys Asn Lys Gly Tyr Lys Leu Thr Leu Asn 
1300 1305 1310 

Pro Lys Tyr Gly Thr Val Lys Asp Leu Met Leu Asp Glu Val Lys Glu 
1315 1320 1325 

Ile Glu Ala Phe Glu Tyr Ser Gly Tyr Val Tyr Asp Leu Ser Val Glu 
1330 1335 1340 

Asp Asn Glu Asn Phe Leu Val Asn Asn Ile Tyr Ala His Asn Ser Val 
1345 1350 1355 1360' 

Tyr Gly Tyr Leu Ala Phe Pro Arg Ala Arg Phe Tyr Ser Arg Glu Cys 
1365 1370 " 1375 

Ala Glu Ile Val Thr Tyr Leu Gly Arg Lys Tyr lie Leu Glu Thr Val 
1380 1385 1390 

Lys Glu Ala Glu Lys Phe Gly Phe Lys Val Leu Tyr Ile Asp Thr Asp 
1395 1400 1405 

Gly Phe Tyr Ala Ile Trp Lys Glu Lys Ile Ser Lys Glu Glu Leu Ile 
1410 1415 1420 

Lys Lys Ala Met Glu Phe Val Glu Tyr Ile Asn Ser Lys Leu Pro Gly 
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1425 1430 1435 1440 

Thr Met Glu Leu Glu Phe G!u Gly Tyr Phe Lys Arg Gly lie Phe Val 
1445 1450 1455 

Thr Lys Lys Arg Tyr Ala Leu lie Asp Glu Asn Gly Arg Val Thr Val 
1460 1465 1470 

Lys Gly Leu Glu Phe Val Arg Arg Asp Trp Ser Asn He Ala Lys He 
1475 1480 1485 

Thr Gin Arg Arg Val Leu Glu Ala Leu Leu Val Glu Gly Ser lie Glu 
1490 1495 1500 

Lys Ala Lys Lys ile lie Gin Asp Val lie Lys Asp Leu Arg Glu Lys 
1505 1510 1515 1520 

Lys Ile Lys Lys Glu Asp Leu Ile Ile Tyr Thr Gin Leu Thr Lys Asp 
1525 1530 1535 

Pro Lys Glu Tyr Lys Thr Thr Ala Pro His Val Glu Ile Ala Lys Lys 
1540 1545 1550 

Leu Met Arg Glu Gly Lys Arg lie Lys Val Gly Asp Ile Ile Gly Tyr 
1555 1560 1565 

He lie Val Lys Gly Thr Lys Ser lie Ser Glu Arg Ala Lys Leu Pro 
1570 1575 1580 

Glu Glu Val Asp lie Asp Asp Ile Asp Val Asn Tyr Tyr He Asp Asn 
1585 1590 1595 1600 

Gin Ile Leu Pro Pro Val Leu Arg lie Met Glu Ala Val Gly Val Ser 
1605 1610 1615 

Lys Asn Glu Leu Lys Lys Glu Gly Ala Gin Leu Thr Leu Asp Lys Phe 
1620 1625 1630 

Phe Lys 



(2) ANGABEN ZU SEQ ID NO: 25: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 1 235 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 
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(ii) ART DES MOLEK0LS: Protein 



(vi) URSPRONLICHE HERKUNFT: 

(A) ORGANISMUS: Pyrococcus horikoshii 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 25: 

Met lie Leu Asp Ala Asp Tyr He Thr Glu Asp Gly Lys Pro He He 
15 10 15 

Arg He Phe Lys Lys Glu Asn Gly Glu Phe Lys Val Glu Tyr Asp Arg 
20 25 30 

Asn Phe Arg Pro Tyr He Tyr Ala Leu Leu Arg Asp Asp Ser Ala He 
35 40 45 

Asp Glu lie Lys Lys lie Thr Ala Gin Arg His Gly Lys Val Val Arg 
50 55 60 

He Val Glu Thr Glu Lys He Gin Arg Lys Phe Leu Gly Arg Pro He 
65 70 75 80 

Glu Val Trp Lys Leu Tyr Leu Glu His Pro Gin Asp Val Pro Ala lie 
85 90 95 

Arg Asp Lys lie Arg Glu His Pro Ala Val Val Asp He Phe Glu Tyr 
100 105 110 

Asp He Pro Phe Ala Lys Arg Tyr Leu He Asp Lys Gly Leu Thr Pro 
115 120 125 

Met Glu Gly Asn Glu Lys Leu Thr Phe Leu Ala Val Asp He Glu Thr 
130 135 140 

Leu Tyr His Glu Gly Glu Glu Phe Gly Lys Gly Pro Val He Met He 
145 150 155 160 

Ser Tyr Ala Asp Glu Glu Gly Ala Lys Val He Thr Trp Lys Lys He 
165 170 175 

Asp Leu Pro Tyr Val Glu Val Val Ser Ser Glu Arg Glu Met lie Lys 
180 185 190 

Arg Leu lie Arg Val He Lys Glu Lys Asp Pro Asp Val He lie Thr 
195 200 205 

Tyr Asn Gly Asp Asn Phe Asp Phe Pro Tyr Leu Leu Lys Arg Ala Glu 
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210 215 220 

Lys Leu Gly lie Lys Leu Leu Leu Gly Arg Asp Asn Ser Glu Pro Lys 
225 230 235 240 

Met Gin Lys Met Gly Asp Ser Leu Ala Val Glu He Lys Gly Arg lie 
245 250 255 

His Phe Asp Leu Phe Pro Val lie Arg Arg Thr lie Asn Leu Pro Thr 
260 265 270 

Tyr Thr Leu Glu Ala Val Tyr Glu Ala He Phe Gly Lys Pro Lys Glu 
275 280 285 

Lys Val Tyr Ala Asp Glu He Ala Lys Ala Trp Glu Thr Gly Glu Gly 
290 295 300 

Leu Glu Arg Val Ala Lys Tyr Ser Met Glu Asp Ala Lys Val Thr Tyr 
305 310 315 320 

Glu Leu Gly Arg Glu Phe Phe Pro Met Glu Ala Gin Leu Ala Arg Leu 
325 330 335 

Val Gly Gin Pro Val Trp Asp Val Ser Arg Ser Ser Thr Gly Asn Leu 
340 . 345 350 

Val Glu Trp Phe Leu Leu Arg Lys Ala Tyr Glu Arg Asn Glu Leu Ala 
355 360 365 

Pro Asn Lys Pro Asp Glu Lys Glu Tyr Glu Arg Arg Leu Arg Glu Ser 
370 375 380 

Tyr Glu Gly Gly Tyr Val Lys Glu Pro Glu Lys Gly Leu Trp Glu Gly 
385 390 395 400 

He Val Ser Leu Asp Phe Arg Ser Leu Tyr Pro Ser He He He Thr 
405 410 415 

His Asn Val Ser Pro Asp Thr Leu Asn Arg Glu Gly Cys Glu Glu Tyr 
420 425 430 

Asp Val Ala Pro Lys Val Gly His Arg Phe Cys Lys Asp Phe Pro Gly 
435 440 445 

Phe He Pro Ser Leu Leu Gly Gin Leu Leu Glu Glu Arg Gin Lys He 
450 455 460 

Lys Lys Arg Met Lys Glu Ser Lys Asp Pro Val Glu Lys Lys Leu Leu 
465 470 475 480 



ERSATZBLATT (KEGEL 26) 



WO 00/08164 

PCT/DE99/02480 
- 69 - > 



Asp Tyr Arg Gin Arg Ala lie Lys lie Leu Ala Asn Ser He Leu Pro 
485 490 495 

Asp Glu Trp Leu Pro lie Val Glu Asn Glu Lys Val Arg Phe Val Lys 
500 505 510 

lie Gly Asp Phe lie Asp Arg Glu He Glu Glu Asn Ala Glu Arg Val 
515 520 525 

Lys Arg Asp Gly Glu Thr Glu He Leu Glu Val Lys Asp Leu Lys Ala 
530 535 540 

Leu Ser Phe Asn Arg Glu Thr Lys Lys Ser Glu Leu Lys Lys Val Lys 
545 550 555 560 

Ala Leu lie Arg His Arg Tyr Ser Gly Lys Val Tyr Ser He Lys Leu 
565 570 575 

Lys Ser Gly Arg Arg He Lys He Thr Ser Gly His Ser Leu Phe Ser 
580 585 590 

Val Lys Asn Gly Lys Leu Val Lys Val Arg Gly Asp Glu Leu Lys Pro 
595 600 605 

Gly Asp Leu Val Val Val Pro Gly Arg Leu Lys Leu Pro Glu Ser Lys 
610 615 620 

Gin Val Leu Asn Leu Val Glu Leu Leu Leu Lys Leu Pro Glu Glu Glu 
625 630 635 640 

Thr Ser Asn He Val Met Met He Pro Val Lys Gly Arg Lys Asn Phe 
645 650 655 

Phe Lys Gly Met Leu Lys Thr Leu Tyr Trp He Phe Gly Glu Gly Glu 
660 665 670 

Arg Pro Arg Thr Ala Gly Arg Tyr Leu Lys His Leu Glu Arg Leu Gly 
675 680 685 

Tyr Val Lys Leu Lys Arg Arg Gly Cys Glu Val Leu Asp Trp Glu Ser 
690 695 700 

Leu Lys Arg Tyr Arg Lys Leu Tyr Glu Thr Leu He Lys Asn Leu Lys 
705 710 715 720 

Tyr Asn Gly Asn Ser Arg Ala Tyr Met Val Glu Phe Asn Ser Leu Arg 
725 730 735 

Asp Val Val Ser Leu Met Pro lie Glu Glu Leu Lys Glu Trp He He 
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740 745 750 

Gly Glu Pro Arg Gly Pro Lys lie Gly Thr Phe lie Asp Val Asp Asp 
755 760 765 

Ser Phe Ala Lys Leu Leu Gly Tyr Tyr lie Ser Ser Gly Asp Val Glu 
770 775 780 

Lys Asp Arg Val Lys Phe His Ser Lys Asp Gin Asn Val Leu Glu Asp 
785 790 795 800 

lie Ala Lys Leu Ala Glu Lys Leu Phe Gly Lys Val Arg Arg Gly Arg 
805 810 815 

Gly Tyr lie Glu Val Ser Gly Lys lie Ser His Ala lie Phe Arg Val 
820 825 830 

Leu Ala Glu Gly Lys Arg lie Pro Glu Phe lie Phe Thr Ser Pro Met 
835 840 845 

Asp lie Lys Val Ala Phe Leu Lys Gly Leu Asn Gly Asn Ala Glu Glu 
850 855 860 

Leu Thr Phe Ser Thr Lys Ser Glu Leu Leu Val Asn Gin Leu He Leu 
865 870 875 880 

Leu Leu Ash Ser lie Gly Val Ser Asp lie Lys He Glu His Glu Lys 
885 890 895 

Gly Val Tyr Arg Val Tyr lie Asn Lys Lys Glu Ser Ser Asn Gly Asp 
900 905 910 

He Val Leu Asp Ser Val Glu Ser lie Glu Val Glu Lys Tyr Glu Gly 
915 920 925 

Tyr Val Tyr Asp Leu Ser Val Glu Asp Asn Glu Asn Phe Leu Val Gly 
930 935 940 

Phe Gly Leu Leu Tyr Ala His Asn Ser Tyr Tyr Gly Tyr Tyr Gly Tyr 
945 950 955 960 

Ala Lys Ala Arg Trp Tyr Cys Lys Glu Cys Ala Glu Ser Val Thr Ala 
965 970 975 

Trp Gly Arg Gin Tyr He Asp Leu Val Arg Arg Glu Leu Glu Ala Arg 
980 985 990 

Gly Phe Lys Val Leu Tyr He Asp Thr Asp Gly Leu Tyr Ala Thr He 
995 1000 1005 
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Pro Gly Val Lys Asp Trp Glu Glu Val Lys Arg Arg Ala Leu Glu Phe 
1010 1015 1020 

Val Asp Tyr lie Asn Ser Lys Leu Pro Gly Val Leu Glu Leu Glu Tyr 
1025 1030 1035 1040 

Glu Gly Phe Tyr Ala Arg Gly Phe Phe Val Thr Lys Lys Lys Tyr Ala 
1045 1050 1055 

Leu He Asp Glu Glu Gly Lys lie Val Thr Arg Gly Leu Glu lie Val 
1060 1065 . 1070 

Arg Arg Asp Trp Ser Glu lie Ala Lys Glu Thr Gin Ala Arg Val Leu 
1075 1080 1085 

Glu Ala lie Leu Lys His Gly Asn Val Glu Glu Ala Val Lys He Val 
1090 1095 1100 

Lys Asp Val Thr Glu Lys Leu Thr Asn Tyr Glu Val Pro Pro Glu Lys 
1105 1110 1115 1120 

Leu Val He Tyr Glu Gin He Thr Arg Pro He Asn Glu Tyr Lys Ala 
1125 1130 1135 

lie Gly Pro His Val Ala Val Ala Lys Arg Leu Met Ala Arg Gly He 
1140 ■ • 1145 1150 

Lys Val Lys Pro Gly Met Val He Gly Tyr He Val Leu Arg Gly Asp 
1155 1160 1165 

Gly Pro He Ser Lys Arg Ala lie Ser lie Glu Glu Phe Asp Pro Arg 
1170 1175 1180 

Lys His Lys Tyr Asp Ala Glu Tyr Tyr He Glu Asn Gin Val Leu Pro 
1185 1190 1195 1200 

Ala Val Glu Arg lie Leu Lys Ala Phe Gly Tyr Lys Arg Glu Asp Leu 
1205 1210 1215 

Arg Trp Gin Lys Thr Lys Gin Val Gly Leu Gly Ala Trp lie Lys Val 
1220 1225 1230 

Lys Lys Ser 
1235 

(2) ANGABEN ZU SEQ ID NO: 26: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 586 Aminosauren 
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(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKClLS: Protein 

(vi) URSPRClNLICHE HERKUNFT: 

(A) ORGANISMUS: Methanobacterium thermdautotrophicum 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 26: 

Met Glu Asp Tyr Arg Met Val Leu Leu Asp lie Asp Tyr Val Thr Val 
15 10 15 

Asp Glu Val Pro Val lie Arg Leu Phe Gly Lys Asp Lys Ser Gly Gly 
20 25 30 

Asn Glu Pro lie lie Ala His Asp Arg Ser Phe Arg Pro Tyr lie Tyr 
35 40 45 

Ala He Pro Thr Asp Leu Asp Glu Cys Leu Arg Glu Leu Glu Glu Leu 
50 55 60 

Glu Leu Glu Lys Leu Glu Val Lys Glu Met Arg Asp Leu Gly Arg Pro 
65 70 75 80 

Thr Glu Val lie Arg He Glu Phe Arg His Pro Gin Asp Val Pro Lys 
85 90 95 

lie Arg Asp Arg He Arg Asp Leu Glu Ser Val Arg Asp He Arg Glu 
100 105 110 

His Asp He Pro Phe Tyr Arg Arg Tyr Leu He Asp Lys Ser He Val 
115 120 125 

Pro Met Glu Glu Leu Glu Phe Gin Gly Val Glu Val Asp Ser Ala Pro 
130 135 140 

Ser Val Thr Thr Asp Val Arg Thr Val Glu Val Thr Gly Arg Val Gin 
145 150 155 160 

Ser Thr Gly Ser Gly Ala His Gly Leu Asp He Leu Ser Phe Asp lie 
165 170 175 

Glu Val Arg Asn Pro His Gly Met Pro Asp Pro Glu Lys Asp Glu He 
180 185 190 
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Val Met lie Gly Val Ala Gly Asn Met Gly Tyr Glu Ser Val lie Ser 
195 200 205 

Thr Ala Gly Asp His Leu Asp Phe Val Glu Val Val Glu Asp Glu Arg 
210 215 220 

Glu Leu Leu Glu Arg Phe Ala Glu lie Val He Asp Lys Lys Pro Asp 
225 230 235 240 

Me Leu Val Gly Tyr Asn Ser Asp Asn Phe Asp Phe Pro Tyr lie Thr 
245 250 255 

Arg Arg Ala Ala lie Leu Gly Ala Glu Leu Asp Leu Gly Trp Asp Gly 
260 265 270 

Ser Lys lie Arg Thr Met Arg Arg Gly Phe Ala Asn Ala Thr Ala lie 
275 280 285 

Lys Gly Thr Val His Val Asp Leu Tyr Pro Val Met Arg Arg Tyr Met 
290 295 300 

Asn Leu Asp Arg Tyr Thr Leu Glu Arg Val Tyr Gin Glu Leu Phe Gly 
305 310 315 320 

Glu Glu Lys He Asp Leu Pro Gly Asp Arg Leu Trp Glu Tyr Trp Asp 
325 330 335 

Arg Asp Glu Leu Arg Asp Glu Leu Phe Arg Tyr Ser Leu Asp Asp Val 
340 345 350 

Val Ala Thr His Arg lie Ala Glu Lys lie Leu Pro Leu Asn Leu Glu 
355 360 365 

Leu Thr Arg Leu Val Gly Gin Pro Leu Phe Asp lie Ser Arg Met Ala 
370 375 380 

Thr Gly Gin Gin Ala Glu Trp Phe Leu Val Arg Lys Ala Tyr Gin Tyr 
385 390 395 400 

Gly Glu Leu Val Pro Asn Lys Pro Ser Gin Ser Asp Phe Ser Ser Arg 
405 410 415 

Arg Gly Arg Arg Ala Val Gly Gly Tyr Val Lys Glu Pro Glu Lys Gly 
420 425 430 

Leu His Glu Asn He Val Gin Phe Asp Phe Arg Ser Leu Tyr Pro Ser 
435 440 445 

lie lie lie Ser Lys Asn He Ser Pro Asp Thr Leu Thr Asp Asp Glu 
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450 455 460 

Glu Ser Glu Cys Tyr Val Ala Pro Glu Tyr Gly Tyr Arg Phe Arg Lys 
465 470 475 480 

Ser Pro Arg Gly Phe Val Pro Ser Val lie Gly Glu He Leu Ser Glu 
485 490 495 

Arg Val Arg lie Lys Glu Glu Met Lys Gly Ser Asp Asp Pro Met Glu 
500 505 510 

Arg Lys He Leu Asn Val Gin Gin Glu Ala Leu Lys Arg Leu Ala Asn 
515 520 525 

Thr Met Tyr Gly Val Tyr Gly Tyr Ser Arg Phe Arg Trp Tyr Ser Met 
530 535 540 

Glu Cys Ala Glu Ala lie Thr Ala Trp Gly Arg Asp Tyr He Lys Lys 
545 550 555 560 

Thr He Lys Thr Ala Glu Glu Phe Gly Phe His Thr Val Tyr Ala Asp 
565 570 575 

Thr Asp Gly Phe Tyr Ala Thr Tyr Arg Gly 
580 . 585 

(2) ANGABEN ZU SEQ ID NO: 27: 

(i) SEQUEIMZKENNZEICHEN: 

(A) LANGE: 1143 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: Protein 

(vi) URSPRONLICHE HERKUNFT: 

(A) ORGANISMUS: Archaeoglobus fulgidus 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 27: 

Met Asp Ala Thr Leu Asp Arg Phe Phe Pro Leu Phe Glu Ser Glu Ser 
15 10 15 

Asn Glu Asp Phe Trp Arg lie Glu Glu He Arg Arg Tyr His Glu Ser 
20 25 30 
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Leu Met Val Glu Leu Asp Arg lie Tyr Arg lie Ala Glu Ala Ala Arg 
35 40 45 

Lys Lys Gly Leu Asp Pro Glu Leu Ser Val Glu He Pro lie Ala Lys 
50 55 60 



Asn Met Ala Glu Arg Val Glu Lys Leu Met Asn Leu Gin Gly Leu Ala 
65 70 75 80. 

Lys Arg lie Met Glu Leu Glu Glu Gly Gly Leu Ser Arg Glu Leu lie 
85 90 95 

Cys Phe Lys Val Ala Asp Glu lie Val Glu Gly Lys Phe Gly Glu Met 
TOO 105 110 

Pro Lys Glu Glu Ala lie Asp Lys Ala Val Arg Thr Ala Val Ala lie 
115 120 125 . 

Met Thr Giu Gly Val Val Ala Ala Pro lie Glu Gly He Ala Arg Val 
130 135 140 



Arg He Asp Arg Glu Asn Phe Leu Arg Val Tyr Tyr Ala Gly Pro He 
145 150 155 160 

Arg Ser Ala Gly Gly Thr Ala Gin Val He Ser Val Leu Val Ala Asp 
165 170 175 

Tyr Val Arg Arg Lys Ala Glu lie Gly Arg Tyr Val Pro Thr Glu Glu 
180 185 190 

Glu He Leu Arg Tyr Cys Glu Glu He Pro Leu Tyr Lys Lys Val Ala 
195 200 205 

Asn Leu Gin Tyr Leu Pro Ser Asp Glu Glu He Arg Leu He Val Ser 
210 215 220 

Asn Cys Pro He Cys He Asp Gly Glu Pro Thr Glu Ser Ala Glu Val 
225 230 235 240 

Ser Gly Tyr Arg Asn Leu Pro Arg Val Glu Thr Asn Arg Val Arg Gly 
245 250 255 

Gly Met Ala Leu Val He Ala Glu Gly He Ala Leu Lys Ala Pro Lys 
260 265 270 

Leu Lys Lys Met Val Asp Glu Val Gly lie Glu Gly Trp Glu Trp Leu 
275 280 285 

Asp Ala Leu He Lys Gly Gly Gly Asp Ser Gly Ser Glu Glu Glu Lys 
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290 295 300 

Ala Val lie Lys Pro Lys Asp Lys Tyr Leu Ser Asp He Val Ala Gly 
305 310 315 320 

Arg Pro Val Leu Ser His Pro Ser Arg Lys Gly Gly Phe Arg Leu Arg 
325 330 335 

Tyr Gly Arg Ala Arg Asn Ser Gly Phe Ala Thr Val Gly Val Asn Pro 
340 345 350 

Ala Thr Met Tyr Leu Leu Glu Phe Val Ala Val Gly Thr Gin Leu Lys 
355 360 365 

Val Glu Arg Pro Gly Lys Ala Gly Gly Val Val Pro Val Ser Thr lie 
370 375 380 

Glu Gly Pro Thr Val Arg Leu Lys Asn Gly Asp Val Val Lys He Asn 
385 390 395 400 

Thr Leu Ser Glu Ala Lys Ala Leu Lys Gly Glu Val Ala Ala lie Leu 
405 410 415 

Asp Leu Gly Glu lie Leu He Asn Tyr Gly Asp Phe Leu Glu Asn Asn 
420 425 430 

His Pro Leu He Pro Ala Ser Tyr Thr Tyr Glu Trp Trp lie Gin Glu 
435 440 445 

Ala Glu Lys Ala Gly Leu Arg Gly Asp Tyr Arg Lys He Ser Glu Glu 
450 455 460 

Glu Ala Leu Lys Leu Cys Asp Glu Phe His Val Pro Leu His Pro Asp 
465 470 475 480 

Tyr Thr Tyr Leu Trp His Asp He Ser Val Glu Asp Tyr Arg Tyr Leu 
485 490 495 

Arg Asn Phe Val Ser Asp Asn Gly Lys He Glu Gly Lys His Gly Lys 
500 505 510 

Ser Val Leu Leu Leu Pro Tyr Asp Ser Arg Val Lys Glu He Leu Glu 
515 520 525 

Ala Leu Leu L u Glu His Lys Val Arg Glu Ser Phe He Val He Glu 
530 535 540 

Thr Trp Arg Ala Phe He Arg Cys Leu Gly Leu Asp Glu Lys Leu Ser 
545 550 555 560 
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Lys Val Ser Glu Val Ser Gly Lys Asp Val Leu Glu lie Val Asn Gly 
565 570 575 

lie Ser Gly He Lys Val Arg Pro Lys Ala Leu Ser Arg lie Gly Ala 
580 585 590 

Arg Met Gly Arg Pro Glu Lys Ala Lys Glu Arg Lys Met Ser Pro Pro 
595 600 605 

Pro His He Leu Phe Pro Val Gly Met Ala Gly Gly Asn Thr Arg Asp 
610 615 620 

lie Lys Asn Ala lie Asn Tyr Thr Lys Ser Tyr Asn Ala Lys Lys Gly 
625 630 635 640 

Glu He Glu Val Glu lie Ala He Arg Lys Cys Pro Gin Cys Gly Lys 
645 650 655 

Glu Thr Phe Trp Leu Lys Cys Asp Val Cys Gly Glu Leu Thr Glu Gin 
660 665 670 

Leu Tyr Tyr Cys Pro Ser Cys Arg Met Lys Asn Thr Ser Ser Val Cys 
675 680 685 

Glu Ser Cys Gly Arg Glu Cys Glu Gly Tyr Met Lys Arg Lys Val Asp 
690 695. 700 

Leu Arg Glu Leu Tyr Glu Glu Ala lie Ala Asn Leu Gly Glu Tyr Asp 
705 710 715 720 

Ser Phe Asp Thr He Lys Gly Val Lys Gly Met Thr Ser Lys Thr Lys 
725 730 735 

lie Pro Giu Arg Leu Glu Lys Gly lie Leu Arg Val Lys His Gly Val 
740 745 750 

Phe Val Phe Lys Asp Gly Thr Ala Arg Phe Asp Ala Thr Asp Leu Pro 
755 760 765 

lie Thr His Phe Lys Pro Ala Glu He Gly Val Ser Val Glu Lys Leu 
770 775 780 

Arg Glu Leu Gly Tyr Glu Arg Asp Tyr Lys Gly Ala Glu Leu Lys Asn 
785 790 795 800 

Glu Asn Gin He Val Glu Leu Lys Pro Gin Asp Val He Leu Pro Lys 
805 810 815 

Ser Gly Ala Glu Tyr Leu Leu Arg Val Ala Asn Phe He Asp Asp Leu 
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820 



825 



830 



Leu Val Lys Phe Tyr Lys Met Glu Pro Phe Tyr Asn Ala Lys Ser Val 
835 840 845 



Glu Asp Leu He Gly His Leu Val lie Gly Leu Ala Pro His Thr Ser 
850 855 860 

Ala Gly Val Leu Gly Arg lie He Gly Phe Ser Asp Val Leu Ala Gly 
865 870 875 880 

Tyr Ala His Pro Tyr Phe His Ala Ala Lys Arg Arg Asn Cys Asp Gly 
885 890 895 

Asp Glu Asp Cys Phe Met Leu Leu Leu Asp Gly Leu Leu Asn Phe Ser 
900 905 910 

Arg Lys Phe Leu Pro Asp Lys Arg Gly Gly Gin Met Asp Ala Pro Leu 
915 920 925 

Val Leu Thr Ala lie Val Asp Pro Arg Glu Val Asp Lys Glu Val His 
930 935 940 

Asn Met Asp He Val Glu Arg Tyr Pro Leu Glu Phe Tyr Glu Ala Thr 
945 950 955 960 

Met Arg Phe Ala Ser Pro Lys Glu Met Glu Asp Tyr Val Glu Lys Val 
965 970 975 

Lys Asp Arg Leu Lys Asp Glu Ser Arg Phe Cys Gly Leu Phe Phe Thr 
980 985 990 

His Asp Thr Glu Asn He Ala Ala Gly Val Lys Glu Ser Ala Tyr Lys 
995 1000 1005 

Ser Leu Lys Thr Met Gin Asp Lys Val Tyr Arg Gin Met Glu Leu Ala 
1010 1015 1020 

Arg Met He Val Ala Val Asp Glu His Asp Val Ala Glu Arg Val He 
1 °25 1030 1035 1040 

Asn Val His Phe Leu Pro Asp He He Gly Asn Leu Arg Ala Phe Ser 
1045 1050 1055 

Arg Gin Glu Phe Arg Cys Thr Arg Cys Asn Thr Lys Tyr Arg Arg lie 
1060 1065 1070 

Pro Leu Val Gly Lys Cys Leu Lys Cys Gly Asn Lys Leu Thr Leu Thr 
1075 1080 1085 
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Val His Ser Ser Ser lie Met Lys Tyr Leu Glu Leu Ser Lys Phe Leu 
1090 1095 1100 

Cys Glu Asn Phe Asn Val Ser Ser Tyr Thr Lys Gin Arg Leu Met Leu 
1105 1110 1115 1120 

Leu Glu Gin Glu lie Lys Ser Met Phe Glu Asn Giy Thr Glu Lys Gin 
1125 1130 1135 

Val Ser lie Ser Asp Phe Val 
1140 

(2) ANGABEN ZU SEQ ID NO: 28: 

(i) SEQUENZKENNZEICHEN: 

(A) LAIMGE: 1139 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(vi) URSPRONLICHE HERKUNFT: 

(A) ORGANISMUS: Methanococcus jannaschii 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 28: 

Met lie Val Met Val His Val Ala Cys Ser Glu Asn Met Lys Lys Tyr 
1 5 10 15 

Phe Glu Asn lie Val Asp Glu Val Lys Lys He Tyr Arg lie Ala Glu 
20 25 30 

Glu Cys Arg Lys Lys Gly Phe Asp Pro Thr Asp Glu Val Glu lie Pro 
35 40 45 

Leu Ala Ala Asp Met Ala Asp Arg Val Glu Gly Leu Val Gly Pro Lys 
50 55 60 

Gly Val Ala Glu Arg lie Arg Glu Leu Val Lys Glu Leu Gly Lys Glu 
65 70 75 80 

Pro Ala Ala Leu Glu lie Ala Lys Glu He Val Glu Gly Lys Phe Gly 
85 90 95 

Asn Phe Asp Lys Glu Lys Lys Ala Glu Gin Ala Val Arg Thr Ala Leu 
100 105 110 
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Ala Val Leu Thr Glu Gly lie Val Ala Ala Pro Leu Glu Gly lie Ala 
115 120 125 

Asp Val Lys He Lys Lys Asn Pro Asp Gly Thr Glu Tyr Leu Ala lie 
130 135 HO 

Tyr Tyr Ala Gly Pro lie Arg Ser Ala Gly Gly Thr Ala Gin Ala Leu 
145 150 155 160 

Ser Val Leu Val Gly Asp Phe Val Arg Lys Ala Met Gly Leu Asp Arq 
165 170 175 

Tyr Lys Pro Thr Glu Asp Glu He Glu Arg Tyr Val Glu Glu Val Glu 
180 1 85 1 90 

Leu Tyr Gin Ser Glu Val Gly Ser Phe Gin Tyr Asn Pro Thr Ala Asp 
195 200 205 

Glu lie Arg Thr Ala lie Arg Asn He Pro lie Glu He Thr Gly Glu 
210 215 220 

Ala Thr Asp Asp Val Glu Val Ser Gly His Arg Asp Leu Pro Arq Val 
225 230 235 240 

Glu Thr Asn Gin Leu Arg Gly Gly Ala Leu Leu Val Leu Val Glu Gly 
245 -* 250 255 

Val Leu Leu Lys Ala Pro Lys lie Leu Arg His Val Asp Lys Leu Gly 
260 265 270 

He Glu Gly Trp Asp Trp Leu Lys Asp Leu Met Ser Lys Lys Glu Glu 
275 280 285 

Lys Glu Glu Glu Lys Asp Glu Lys Val Asp Asp Glu Glu He Asp Glu 
290 295 300 



Glu Glu Glu Glu lie Ser Gly Tyr Trp Arg Asp Val Lys He Glu Ala 
305 310 315 320 

Asn Lys Lys Phe He Ser Glu Val lie Ala Gly Arg Pro Val Phe Ala 
325 330 335 

His Pro Ser Lys Val Gly Gly Phe Arg Leu Arg Tyr Gly Arg Ser Arq 
340 345 350 

Asn Thr Gly Phe Ala Thr Gin Gly Phe His Pro Ala Leu Met Tyr Leu 
355 360 365 

Val Asp Glu Phe Met Ala Val Gly Thr Gin Leu Lys Thr Glu Arg Pro 
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370 375 380 

Gly Lys Ala Thr Cys Val Val Pro Val Asp Ser He Glu Pro Pro lie 
385 390 395 400 

Val Lys Leu Lys Asn Gly Asp Val lie Arg Val Asp Thr lie Glu Lys 
405 410 415 

Ala Met Asp Val Arg Asn Arg Val Glu Glu lie Leu Phe Leu Gly Asp 
420 425 430 

Val Leu Val Asn Tyr Gly Asp Phe Leu Glu Asn Asn His Pro Leu Leu 
435 440 445 

Pro Ser Cys Trp Cys Glu Glu Trp Tyr Glu Lys lie Leu lie Ala Asn 
450 455 460 



Asn He Glu Tyr Asp Lys Asp Phe He Lys Asn Pro Lys Pro Glu Glu 
465 470 475 480 

Ala Val Lys Phe Ala Leu Glu Thr Lys Thr Pro Leu His Pro Arg Phe 
485 490 " 495 

Thr Tyr His Trp His Asp Val Ser Lys Glu Asp He He Leu Leu Arg 
500 505 510 

Asn Trp Leu Leu Lys Gly Lys Glu Asp Ser Leu Glu Gly Lys Lys Val 
515 520 525 

Trp lie Val Asp Leu Glu lie Glu Glu Asp Lys Lys Ala Lys Arg lie 
530 535 540 

Leu Glu Leu He Gly Cys Cys His Leu Val Arg Asn Lys Lys Val He 
545 550 555 560 

He Glu Glu Tyr Tyr Pro Leu Leu Tyr Ser Leu Gly Phe Asp Val Glu 
565 570 575 

Asn Lys Lys Asp Leu Val Glu Asn He Glu Lys He Leu Glu Ser Ala 
580 585 590 

Lys Asn Ser Met His Leu lie Asn Leu Leu Ala Pro Phe Glu Val Arg 
595 600 605 

Arg Asn Thr Tyr Val Tyr Val Gly Ala Arg Met Gly Arg Pro Glu Lys 
610 615 620 

Ala Ala Pro Arg Lys Met Lys Pro Pro Val Asn Gly Leu Phe Pro He 
625 630 635 640 
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Gly Asn Ala Gly Gly Gin Val Arg Leu lie Asn Lys Ala Val Glu Glu 
645 650 655 

Asn Asn Thr Asp Asp Val Asp Val Ser Tyr Thr Arg Cys Pro Asn Cys 
660 665 670 

Gly Lys lie Ser Leu Tyr Arg Val Cys Pro Phe Cys Gly Thr Lys Val 
675 680 685 

Glu Leu Asp Asn Phe Gly Arg lie Lys Ala Pro Leu Lys Asp Tyr Trp 
690 695 700 

Tyr Ala Ala Leu Lys Arg Leu Gly lie Asn Lys Pro Gly Asp Val Lys 
705 710 715 720 

Cys lie Lys Gly Met Thr Ser Lys Gin Lys lie Val Glu Pro Leu Glu 
725 730 735 

Lys Ala lie Leu Arg Ala lie Asn Glu Val Tyr Val Phe Lys Asp Gly 
740 745 750 

Thr Thr Arg Phe Asp Cys Thr Asp Val Pro Val Thr His Phe Lys Pro 
755 760 765 

Asn Glu lie Asn Val Thr Val Glu Lys Leu Arg Glu Leu Gly Tyr Asp 
770 775 780 

Lys Asp lie Tyr Gly Asn Glu Leu Val Asp Gly Glu Gin Val Val Glu 
785 790 795 800 

Leu Lys Pro Gin Asp Val lie He Pro Glu Ser Cys Ala Glu Tyr Phe 
805 810 815 

Val Lys Val Ala Asn Phe He Asp Asp Leu Leu Glu Lys Phe Tyr Lys 
820 825 830 

Val Glu Arg Phe Tyr Asn Val Lys Lys Lys Glu Asp Leu lie Gly His 
835 840 845 

Leu Val He Gly Met Ala Pro His Thr Ser Ala Gly Met Val Gly Arg 
850 855 860 

He He Gly Tyr Thr Lys Ala Asn Val Gly Tyr Ala His Pro Tyr Phe 
865 870 875 880 

His Ala Ala Lys Arg Arg Asn Cys Asp Gly Asp Glu Asp Ser Phe Phe 
885 890 895 

Leu Leu Leu Asp Ala Phe Leu Asn Phe Ser Lys Lys Phe Leu Pro Asp 
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900 905 910 

Lys Arg Gly Gly Gin Met Asp Ala Pro Leu Val Leu Thr Thr lie Leu 
915 920 925 



Asp Pro Lys Glu Val Asp Gly Glu Val His Asn Met Asp Thr Met Trp 
930 935 940 

Ser Tyr Pro Leu Glu Phe Tyr Glu Lys Thr Leu Glu Met Pro Ser Pro 
945 950 955 960 

Lys Glu Val Lys Glu Phe Met Glu Thr Val Glu Asp Arg Leu Gly Lys 
965 970 975 

Pro Glu Gin Tyr Glu Gly lie Gly Tyr. Thr His Glu Thr Ser Arg He 
980 985 990 

Asp Leu Gly Pro Lys Val Cys Ala Tyr Lys Thr Leu Gly Ser Met Leu 
995 1000 1005 

Glu Lys Thr Thr Ser Gin Leu Ser Val Ala Lys Lys He Arg Ala Thr 
1010 1015 1020 

Asp Glu Arg Asp Val Ala Glu Lys Val He Gin Ser His Phe He Pro 
1025 1030 1035 1040 

Asp Leu lie Gly Asn Leu Arg Ala Phe Ser Arg Gin Ala Val Arg Cys 
1045 1050 1055 

Lys Cys Gly Ala Lys Tyr Arg Arg lie Pro Leu Lys Gly Lys Cys Pro 
1060 1065 1070 

Lys Cys Gly Ser Asn Leu He Leu Thr Val Ser Lys Gly Ala Val Glu 
1075 1080 1085 

Lys Tyr Met Asp Val Ala Glu Lys Met Ala Glu Glu Tyr Asn Val Asn 
1090 1095 1100 

Asp Tyr lie Lys Gin Arg Leu Lys He He Lys Glu Gly He Asn Ser 
1105 1110 1115 1120 

lie Phe Glu Asn Glu Lys Ser Arg Gin Val Lys Leu Ser Asp Phe Phe 
1125 1130 1135 

Lys He Gly 



(2) ANGABEN ZU SEQ ID NO: 29: 
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(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 1434 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(vi) URSPRUNLICHE HERKUNFT: 

(A) ORGANISMUS: Pyrococcus horikoshii 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 29: 

Met Val Leu Met Glu Leu Pro Lys Glu Met Glu Glu Tyr Phe Ser Met 
15 10 15 

Leu Gin Arg Glu He Asp Lys Ala Tyr Glu lie Ala Lys Lys Ala Arg 
20 25 30 

Ala Gin Gly Lys Asp Pro Ser Leu Asp Val Glu He Pro Gin Ala Ser 
35 40 45 

Asp Met Ala Gly Arg Val Glu Ser Leu Val Gly Pro Pro Gly Val Ala 
50 55 60 

Glu Arg He Arg Glu Leu Val Lys Glu Tyr Gly Lys Glu He Ala Ala 
65 70 75 80 

Leu Lys He Val Asp Glu He He Asp Gly Lys Phe Gly Asp Leu Gly 
85 90 95 

Ser Lys Glu Lys Tyr Ala Glu Gin Ala Val Arg Thr Ala Leu Ala lie 
100 105 110 

Leu Thr Glu Gly Val Val Ser Ala Pro He Glu Gly He Ala Ser Val 
115 120 125 

Lys He Lys Arg Asn Thr Trp Ser Asp Asn Ser Glu Tyr Leu Ala Leu 
130 135 140 

Tyr Tyr Ala Gly Pro He Arg Ser Ser Gly Gly Thr Ala Gin Ala Leu 
145 150 155 160 

Ser Val Leu Val Gly Asp Tyr Val Arg Arg Lys Leu Gly Leu Asp Arg 
165 170 175 

. Phe Lys Pro Ser Glu Lys His He Glu Arg Met Val Glu Glu Val Asp 
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180 185 190 

Leu Tyr His Arg Thr Val Ser Arg Leu Gin Tyr His Pro Ser Pro Glu 
195 200 205 

Glu Val Arg Leu Ala Met Arg Asn He Pro lie Glu lie Thr Gly Glu 
210 215 220 

Ala Thr Asp Glu Val Glu Val Ser His Arg Asp lie Pro Gly Val Glu 
225 230 235 240 

Thr Asn Gin Leu Arg Gly Gly Ala lie Leu Val Leu Ala Glu Gly Val 
245 250 255 

Leu Gin Lys Ala Lys Lys Leu Val Lys Tyr He Asp Lys Met Gly He 
260 265 270 

Glu Gly Trp Glu Trp Leu Lys Glu Phe Val Glu Ala Lys Glu Lys Gly 
275 280 285 

Glu Glu He Glu Glu Glu Gly Ser Ala Glu Ser Thr Val Glu Glu Thr 
290 295 300 

Lys Val Glu Val Asp Met Gly Phe Tyr Tyr Ser Leu Tyr Gin Lys Phe 
305 310 315 320 

Lys Ser Glu He Ala Pro Asn Asp Lys Tyr Ala Lys Glu He lie Gly 
325 330 335 

Gly Arg Pro Leu Phe Ser Asp Pro Ser Arg Asn Gly Gly Phe Arg Leu 
340 345 350 

Arg Tyr Gly Arg Ser Arg Val Ser Gly Phe Ala Thr Trp Gly He Asn 
355 360 365 

Pro Ala Thr Met lie Leu Val Asp Glu Phe Leu Ala lie Gly Thr Gin 
370 375 380 

Leu Lys Thr Glu Arg Pro Gly Lys Gly Ala Val Val Thr Pro Val Thr 
385 390 395 400 

Thr He Glu Gly Pro He Val Lys Leu Lys Asp Gly Ser Val Val Lys 
405 410 415 

Val Asp Asp Tyr Lys Leu Ala Leu Lys He Arg Asp Glu Val Glu Glu 
420 425 430 

He Leu Tyr Leu Gly Asp Ala Val He Ala Phe Gly Asp Phe Val Glu 
435 440 445 
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Asn Asn Gin Thr Leu Leu Pro Ala Asn Tyr Cys Glu Glu Trp Trp He 
450 455 460 

Leu Glu Phe Thr Lys Ala Leu Asn Glu lie Tyr Glu Val Glu Leu Lys 
465 470 475 480 

Pro Phe Glu Val Asn Ser Ser Glu Asp Leu Glu Glu Ala Ala Asp Tyr 
485 490 495 

Leu Glu Val Asp He Glu Phe Leu Lys Glu Leu Leu Lys Asp Pro Leu 
500 505. 510 

Arg Thr Lys Pro Pro Val Glu Leu Ala lie His Phe Ser Glu He Leu 
515 520 525 

Gly He Pro Leu His Pro Tyr Tyr Thr Leu Tyr Trp Asn Ser Val Lys 
530 535 540 

Pro Glu Gin Val Glu Lys Leu Trp Arg Val Leu Lys Glu His Ala His 
545 550 555 560 

He Asp Trp Asp Asn Phe Arg Gly lie Lys Phe Ala Arg Arg lie Val 
565 570 575 

He Pro Leu Glu Lys. Leu Arg Asp Ser Lys Arg Ala Leu Glu Leu Leu 
580 585 590 

Gly Leu Pro His Lys Val Glu Gly Lys Asn Val lie Val Asp Tyr Pro 
595 600 605 

Trp Ala Ala Ala Leu Leu Thr Pro Leu Gly Asn Leu Glu Trp Glu Phe 
610 615 620 

Arg Ala Lys Pro Leu His Thr Thr He Asp He He Asn Glu Asn Asn 
625 630 635 640 

Glu lie Lys Leu Arg Asp Arg Gly He Ser Trp He Gly Ala Arg Met 
645 650 655 

Gly Arg Pro Glu Lys Ala Lys Glu Arg Lys Met Lys Pro Pro Va! Gin 
660 665 670 

Val Leu Phe Pro lie Gly Leu Ala Gly Gly Ser Ser Arg Asp He Lys 
675 680 685 

Lys Ala Ala Glu Glu Gly Lys Val Ala Glu Val Glu He Ala Leu Phe 
690 695 700 

Lys Cys Pro Lys Cys Gly His Val Gly Pro Glu His lie Cys Pro Asn 
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705 



710 



715 



720 



Cys Gly Thr Arg Lys Glu Leu lie Trp Val Cys Pro Arg Cys Asn Ala 
725 730 735 

Glu Tyr Pro Glu Ser Gin Ala Ser Gly Tyr Asn Tyr Thr Cys Pro Lys 
740 745 750 

Cys Asn Val Lys Leu Lys Pro Tyr Ala Lys Arg Lys He Lys Pro Ser 
755 760 765 

Glu Leu Leu Lys Arg Ala Met Asp Asn Val Lys Val Tyr Gly lie Asp 
770 775 780 

Lys Leu Lys Gly Val Met Gly Met Thr Ser Gly Trp Lys Met Pro Glu 
785 790 795 800 

Pro Leu Glu Lys Gly Leu Leu Arg Ala Lys Asn Asp Val Tyr Val Phe 
805 810 815 

Lys Asp Gly Thr He Arg Phe Asp Ala Thr Asp Ala Pro He Thr His 
820 825 830 

Phe Arg Pro Arg Glu He Gly Val Ser Val Glu Lys Leu Arg Glu Leu 
835 840 845 

Gly Tyr Thr His Asp Phe Glu Gly Asn Pro Leu Val Ser Glu Asp Gin 
850 855 860 

lie Val Glu Leu Lys Pro Gin Asp He He Leu Ser Lys Glu Ala Gly 
865 870 875 880 

Lys Tyr Leu Leu Lys Val Ala Lys Phe Val Asp Asp Leu Leu Glu Lys 
885 890 895 

Phe Tyr Gly Leu Pro Arg Phe Tyr Asn Ala Glu Lys Met Glu Asp Leu 
900 905 910 

He Gly His Leu Val lie Gly Leu Ala Pro His Thr Ser Ala Gly He 
915 920 925 

Val Gly Arg He He Gly Phe Val Asp Ala Leu Val Gly Tyr Ala His 
930 935 940 

Pro Tyr Phe His Ala Ala Lys Arg Arg Asn Cys Phe Pro Gly Asp Thr 
945 950 955 960 

Arg He Leu Val Gin He Asn Gly Thr Pro Gin Arg Val Thr Leu Lys 



965 



970 



975 
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Glu Leu Tyr Glu Leu Phe Asp Glu Glu His Tyr Glu Ser Met Val Tyr 
980 985 990 

Val Arg Lys Lys Pro Lys Val Asp lie Lys Val Tyr Ser Phe Asn Pro 
995 1000 1005 

Glu Glu Gly Lys Val Val Leu Thr Asp lie Glu Glu Val lie Lys Ala 
1010 1015 1020 

Pro Ala Thr Asp His Leu He Arg Phe Glu Leu Giu Leu Gly Ser Ser 
1025 1030 1035 1040 

Phe Glu Thr Thr Val Asp His Pro Val Leu Val Tyr Glu Asn Gly Lys 
1045 1050 1055 

Phe Val Glu Lys Arg Ala Phe Glu Val Arg Glu Gly Asn lie He He 
1060 1065 1070 

He He Asp Glu Ser Thr Leu Glu Pro Leu Lys Val Ala Val Lys Lys 
1075 1080 1085 

He Glu Phe lie Glu Pro Pro Glu Asp Phe Val Phe Ser Leu Asn Ala 
1090 1095 1100 

Lys Lys Tyr His Thr Val He He Asn Glu Asn He Val Thr His Gin 
1105 1110 1115 1120 

Cys Asp Gly Asp Glu Asp Ala Val Met Leu Leu Leu Asp Ala Leu Leu 
1125 1130 1135 

Asn Phe Ser Arg Tyr Tyr Leu Pro Glu Lys Arg Gly Gly Lys Met Asp 
1140 1145 1150 

Ala Pro Leu Val He Thr Thr Arg Leu Asp Pro Arg Glu Val Asp Ser 
1155 1160 1165 

Glu Val His Asn Met Asp He Val Arg Tyr Tyr Pro Leu Glu Phe Tyr 
1170 1175 1180 

Glu Ala Thr Tyr Glu Leu Lys Ser Pro Lys Glu Leu Val Gly Val He 
1185 1190 1195 1200 

Glu Arg Val Glu Asp Arg Leu Gly Lys Pro Glu Met Tyr Tyr Gly Leu 
1205 1210 1215 

Lys Phe Thr His Asp Thr Asp Asp He Ala Leu Gly Pro Lys Met Ser 
1220 1225 1230 

Leu Tyr Lys Gin Leu Gly Asp Met Glu Glu Lys Val Lys Arg Gin Leu 
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1235 1240 1245 

Asp Val Ala Arg Arg lie Arg Ala Val Asp Glu His Lys Val Ala Glu 
1250 1255 1260 

Thr He Leu Asn Ser His Leu lie Pro Asp Leu Arg Gly Asn Leu Arg 
1265 1270 1275 1280 

Ser Phe Thr Arg Gin Glu Phe Arg Cys Val Lys Cys Asn Thr Lys Phe 
1285 1290 1295 

Arg Arg Pro Pro Leu Asp Gly Lys Cys Pro lie Cys Gly Gly Lys He 
1300 1305 1310 

Val Leu Thr Val Ser Lys Gly Ala lie Glu Lys Tyr Leu Gly Thr Ala 
1315 1320 1325 

Lys Met Leu Val Thr Glu Tyr Lys Val Lys Asn Tyr Tfir Arg Gin Arg 
1330 1335 1340 

He Cys Leu Thr Glu Arg Asp He Asp Ser Leu Phe Glu Thr Val Phe 
1345 1350 1355 1360 

Pro Glu Thr Gin Leu Thr Leu Leu Val Asn Pro Asn Asp He Cys Gin 
1365 1370 1375 

Arg lie He Met Glu Arg Thr Gly Gly Ser Lys Lys Ser Gly Leu Leu 
1380 1385 1390 

Glu Asn Phe Ala Asn Gly Tyr Asn Lys Gly Lys Lys Glu Glu Met Pro 
1395 1400 1405 

Lys Lys Gin Arg Lys Lys Glu Gin Glu Lys Ser Lys Lys Arg Lys Val 
1410 1415 1420 

He Ser Leu Asp Asp Phe Phe Ser Arg Lys 
1425 1430 

(2) ANGABEN ZU SEQ ID NO: 30: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 1092 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: Protein 
<vi) URSPRUNLICHE HERKUNFT: 
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(A) ORGANISMUS: Methanobacterium thermoautotrophicum 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 30: 

Met Met Asp Tyr Phe Asn Glu Leu Giu Arg Glu Thr Glu Arg Leu Tyr 
1 5 ' 10 15 

Glu lie Ala Arg Lys Ala Arg Ala Arg Gly Leu Asp Val Ser Thr Thr 
20 25 - ^ 30 

Pro Glu lie Pro Leu Ala Lys Asp Leu Ala Glu Arg Val Glu Gly Leu 
35 40 45 

Val Gly Pro Glu Gly He Ala Arg Arg He Lys Glu Leu Glu Gly Asp 
50 55 60 

Arg Gly Arg Glu Glu Val Ala Phe Gin He Ala Ala Glu He Ala Ser 
65 70 75 80 

Gin Ala Val Pro Asp Asp Asp Pro Glu Glu Arg Glu Lys Leu Ala Asp 
85 90 95 

Gin Ala Leu Arg Thr Ala Leu Ala lie Leu Thr Glu Gly Val Val Ala 
100 105 110 

Ala Pro Leu Glu Gly He Ala Arg Val Arg lie Lys Glu Asn Phe Asp 
115 120 125 

Lys Ser Arg Tyr Leu Ala Val Tyr Phe Ala Gly Pro He Arg Ser Ala 
130 135 140 

Gly Gly Thr Ala Ala Ala Leu Ser Val Leu He Ala Asp Tyr He Arg 
145 150 155 160 

Leu Ala Va! Gly Leu Asp Arg Tyr Lys Pro Val Glu Arg Glu lie Glu 
165 170 175 

Arg Tyr Val Glu Glu Val Glu Leu Tyr Glu Ser Glu Val Thr Asn Leu 
180 185 190 

Gin Tyr Ser Pro Lys Pro Asp Glu Val Arg Leu Ala Ala Ser Lys lie 
1 95 200 205 

Pro Val Glu Val Thr Gly Glu Pro Thr Asp Lys Val Glu Val Ser His 
210 215 220 

Arg Asp. Leu Glu Arg Val Glu Thr Asn Asn He Arg Gly Gly Ala Leu 
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225 



230 



235 



240 



Leu Ala Met Val Glu Gly Val He Gin Lys Ala Pro Lys Val Leu Lys 
245 250 255 

Tyr Ala Lys Gin Leu Lys Leu Glu Gly Trp Asp Trp Leu Glu Lys Phe 
260 265 270 

Ser Lys Ala Pro Lys Lys Gly Glu Gly Glu Glu Lys Val Val Val Lys 
275 280 285 

Ala Asp Ser Lys Tyr Val Glu Asp lie lie Gly Gly Arg Pro Val Leu 
290 295 300 

Ala Tyr Pro Ser Glu Lys Gly Ala Phe Arg Leu Arg Tyr Gly Arg Ala 
305 310 315 320 

Arg Asn Thr Gly Leu Ala Ala Met Gly Val His Pro Ala Thr Met Glu 
325 330 335 

Leu Leu Gin Phe Leu Ala Val Gly Thr Gin Met Lys He Glu Arg Pro 
340 345 350 

* 

Gly Lys Gly Asn Cys Val Val Pro Val Asp Thr lie Asp Gly Pro Val 
355 360 365 

Val Lys Leu Arg Asn Gly Asp Val lie Arg He Glu Asp Ala Glu Thr 
370 375 380 

Ala Ser Arg Val Arg Ser Glu Val Glu Glu He Leu Phe Leu Gly Asp 
385 ^ 390 395 400 

Met Leu Val Ala Phe Gly Glu Phe Leu Arg Asn Asn His Val Leu Met 
405 410 415 

Pro Ala Gly Trp Cys Glu Glu Trp Trp lie Gin Thr He Leu Ser Ser 
420 425 430 

Pro Lys Tyr Pro Gly Asp Asp Pro Leu Asn Leu Ser Tyr Tyr Arg Thr 
435 440 445 

Arg Trp Asn Glu Leu Glu Val Ser Ala Gly Asp Ala Phe Arg He Ser 
450 455 460 

Glu Glu Tyr Asp Val Pro Leu His Pro Arg Tyr Thr Tyr Phe Tyr His 
465 470 475 480 

Asp Val Thr Val Arg Glu Leu Asn Met Leu Arg Glu Trp Leu Asn Thr 



485 



490 



495 
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Ser Gin Leu Glu Asp Glu Leu Val Leu Glu Leu Arg Pro Glu Lys Arg 
500 505 510 

lie Leu Glu lie Leu Gly Val Pro His Arg Val Lys Asp Ser Arg Val 
515 520 525 

Val He Gly His Asp Asp Ala His Ala Leu lie Lys Thr Leu Arg Lys 
530 535 540 

Pro Leu Glu Asp Ser Ser Asp Thr Val Glu Ala Leu Asn Arg Val Ser 
545 550 . 555 560 

Pro Val Arg lie Met Lys Lys Ala Pro Thr Tyr lie Gly Thr Arg Val 
565 570 575 

Gly Arg Pro Glu Lys Thr Lys Glu Arg Lys Met Arg Pro Ala Pro His 
580 585 590 

Val Leu Phe Pro He Gly Lys Tyr Gly Gly Ser Arg Arg Asn lie Pro 
595 600 605 

Asp Ala Ala Lys Lys Gly Ser lie Thr Val Glu He Gly Arg Ala Thr 
610 615 620 

Cys Pro Ser Cys Arg Val Ser Ser Met Gin Ser He Cys Pro Ser Cys 
625 630* 635 640 

Gly Ser Arg Thr Val He Gly Glu Pro Gly Lys Arg Asn He Asn Leu 
645 650 655 

Ala Ala Leu Leu Lys Arg Ala Ala Glu Asn Val Ser Val Arg Lys Leu 
660 665 670 

Asp Glu He Lys Gly Val Glu Gly Met He Ser Ala Glu Lys Phe Pro 
675 680 685 

Glu Pro Leu Glu Lys Gly He Leu Arg Ala Lys Asn Asp Val Tyr Thr 
690 695 700 

Phe Lys Asp Ala Thr He Arg His Asp Ser Thr Asp Leu Pro Leu Thr 
705 710 715 720 

His Phe Thr Pro Arg Glu Val Gly Val Ser Val Glu Arg Leu Arg Glu 
725 730 735 

Leu Gly Tyr Thr Arg Asp Cys Tyr Gly Asp Glu Leu Glu Asp Glu Asp 
740 745 750 

Gin He Leu Glu Leu Arg Val Gin Asp Val Val lie Ser Glu Asp Cys 
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755 760 765 

Ala Asp Tyr Leu Val Arg Val Ala Asn Phe Val Asp Asp Leu Leu Glu 
770 775 780 

Arg Phe Tyr Asp Leu Glu Arg Phe Tyr Asn Val Lys Thr Arg Glu Asp 
785 790 795 800 

Leu Val Gly His Leu lie Ala Gly Leu Ala Pro His Thr Ser Ala Ala 
805 810 815 

Val Leu Gly Arg He lie Gly Phe Thr Gly Ala Ser Ala Cys Tyr Ala 
820 825 830 

His Pro Tyr Phe His Ser Ala Lys Arg Arg Asn Cys Asp Ser Asp Glu 
835 840 845 

Asp Ser Val Met Leu Leu Leu Asp Ala Leu Leu Asn Phe Ser Lys Ser 
850 855 860 

Tyr Leu Pro Ser Ser Arg Gly Gly Ser Met Asp Ala Pro Leu Val Leu 
865 870 875 880 

Ser Thr Arg lie Asp Pro Glu Glu He Asp Asp Glu Ser His Asn He 
885 890 895 

Asp Thr Met Asp Met He Pro Leu Glu Val Tyr Glu Arg Ser Phe Asp 
900 905 910 

His Pro Arg Pro Ser Glu Val Leu Asp Val He Asp Asn Val Glu Lys 
915 920 925 

Arg Leu Gly Lys Pro Glu Gin Tyr Thr Gly Leu Met Phe Ser His Asn 
930 935 940 

Thr Ser Arg lie Asp Glu Gly Pro Lys Val Cys Leu Tyr Lys Leu Leu 
945 " 950 955 960 

Pro Thr Met Lys Glu Lys Val Glu Ser Gin He Thr Leu Ala Glu Lys 
965 970 975 

He Arg Ala Val Asp Gin Arg Ser Val Val Glu Gly Val Leu Met Ser 
980 985 990 

His Phe Leu Pro Asp Met Met Gly Asn He Arg Ala Phe Ser Arg Gin 
995 1000 1005 

Lys Val Arg Cys Thr Lys Cys Asn Arg Lys Tyr Arg Arg lie Pro Leu 
1010 1015 1020 
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Ser Gly Glu Cys Arg Cys Gly Gly Asn Leu Val Leu Thr Val Ser Lys 
1025 1030 1035 1040 

Gly Ser Val lie Lys Tyr Leu Glu lie Ser Lys Glu Leu Ala Ser Arg 
1045 1050 1055 

Tyr Pro lie Asp Pro Tyr Leu Met Gin Arg lie Glu lie Leu Glu Tyr 
1060 1065 1070 

Gly Val Asn Ser Leu Phe Glu Ser Asp Arg Ser Lys Gin Ser Ser Leu 
1075 1080 1085 

Asp Val Phe Leu 
1090 

(2) ANGABEN ZU SEQ ID NO: 31: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 1263 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: Protein 

(vi) URSPRUNLICHE HERKUNFT: 

(A) ORGANISMUS: Pyrococcus furiosus 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 31: 

Met Glu Leu Pro Lys Glu He Glu Glu Tyr Phe Glu Met Leu Gin Arg 
15 10 15 

Glu He Asp Lys Ala Tyr Glu He Ala Lys Lys Ala Arg Ser Gin Gly 
20 25 30 

Lys Asp Pro Ser Thr Asp Val Glu lie Pro Gin Ala Thr Asp Met Ala 
35 40 45 

Gly Arg Val Glu Ser Leu Val Gly Pro Pro Gly Val Ala Gin Arg He 
50 55 60 

Arg Glu Leu Leu Lys Glu Tyr Asp Lys Glu He Val Ala Leu Lys He 
65 70 75 80 

Val Asp Glu He He Glu Gly Lys Phe Gly Asp Phe Gly Ser Lys Glu 
85 90 95 
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Lys Tyr Ala Giu Gin Ala Val Arg Thr Ala Leu Ala Me Leu Thr Glu 
100 105 110 

Gly He Val Ser Ala Pro Leu Glu Gly lie Ala Asp Val Lys He Lys 
115 120 125 

Arg Asn Thr Trp Ala Asp Asn Ser Glu Tyr Leu Ala Leu Tyr Tyr Ala 
130 135 140 

Gly Pro lie Arg Ser Ser Gly Gly Thr Ala Gin Ala Leu Ser Val Leu 
145 " 150 155 160 

Val Gly Asp Tyr Val Arg Arg Lys Leu Gly Leu Asp Arg Phe Lys Pro 
165 170 175 

Ser Gly Lys His lie Glu Arg Met Val Glu Glu Val Asp Leu Tyr His 
180 185 190 

Arg Ala Val Ser Arg Leu Gin Tyr His Pro Ser Pro Asp Glu Val Arg 
195 200 205 

Leu Ala Met Arg Asn He Pro He Glu lie Thr Gly Glu Ala Thr Asp 
210 " 215 220 

Asp Val Glu Val Ser His Arg Asp Val Glu Gly Val Glu Thr Asn Gin 
225 230 235 240 

Leu Arg Gly Gly Ala He Leu Val Leu Ala Glu Gly Val Leu Gin Lys 
245 250 255 

Ala Lys Lys Leu Val Lys Tyr lie Asp Lys Met Gly lie Asp Gly Trp 
260 265 270 

Glu Trp Leu Lys Glu Phe Val Glu Ala Lys Glu Lys Gly Glu Glu He 
275 280 285 

Glu Glu Ser Glu Ser Lys Ala Glu Glu Ser Lys Val Glu Thr Arg Val 
290 295 300 

Glu Val Glu Lys Gly Phe Tyr Tyr Lys Leu Tyr Glu Lys Phe Arg Ala 
305 310 315 320 

Glu He Ala Pro Ser Glu Lys Tyr Ala Lys Glu He lie Gly Gly Arg 
325 330 335 

Pro Leu Phe Ala Gly Pro Ser Glu Asn Gly Gly Phe Arg Leu Arg Tyr 
340 345 350 

Gly Arg Ser Arg Val Ser Gly Phe Ala Thr Trp Ser He Asn Pro Ala 
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355 



360 



365 



Thr Met Val Leu Val Asp Glu Phe Leu Ala lie Gly Thr Gin Met Lys 
370 375 380 

Thr Glu Arg Pro Gly Lys Gly Ala Val Val Thr Pro Ala Thr Thr Ala 
385 390 395 400 

Glu Gly Pro lie Val Lys Leu Lys Asp Gly Ser Val Val Arg Val Asp 
405 410 415 

Asp Tyr Asn Leu Ala Leu Lys lie Arg Asp Glu Val Glu Glu lie Leu 
420 425 ' 430 

Tyr Leu Gly Asp Ala lie He Ala Phe Gly Asp Phe Val Glu Asn Asn 
435 440 445 

Gin Thr Leu Leu Pro Ala Asn Tyr Val Glu Glu Trp Trp He Gin Glu 
450 455 460 

Phe Val Lys Ala Val Asn Glu Ala Tyr Glu Val Glu Leu Arg Pro Phe 
465 470 475 480 

Glu Glu Asn Pro Arg Glu Ser Val Glu Glu Ala Ala Glu Tyr Leu Glu 
485 490 495 

Val Asp Pro Glu Phe Leu Ala Lys Met Leu Tyr Asp Pro Leu Arg Val 
500 505 510 

Lys Pro Pro Val Glu Leu Ala lie His Phe Ser Glu He Leu Glu He 
515 520 525 

Pro Leu His Pro Tyr Tyr Thr Leu Tyr Trp Asn Thr Val Asn Pro Lys 
530 535 540 

Asp Val Glu Arg Leu Trp Gly Val Leu Lys Asp Lys Ala Thr He Glu 
545 550 555 560 

Trp Gly Thr Phe Arg Gly He Lys Phe Ala Lys Lys lie Glu lie Ser 



Leu Asp Asp Leu Gly Ser Leu Lys Arg Thr Leu Glu Leu Leu Gly Leu 
580 585 590 

Pro His Thr Val Arg Glu Gly lie Val Val Val Asp Tyr Pro Trp Ser 
595 600 605 

Ala Ala Leu Leu Thr Pro Leu Gly Asn Leu Glu Trp Glu Phe Lys Ala 



565 



570 



575 



610 



615 



620 
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Lys Pro Phe Tyr Thr Val lie Asp lie He Asn Glu Asn Asn Gin lie 
625 630 635 640 

Lys Leu Arg Asp Arg Gly lie Ser Trp He Gly Ala Arg Met Gly Arg 
645 650 655 

Pro Glu Lys Ala Lys Giu Arg Lys Met Lys Pro Pro Val Gin Val Leu 
660 665 670 

Phe Pro He Gly Leu Ala Gly Gly Ser Ser Arg Asp He Lys Lys Ala 
675 680 685 

Ala Glu Glu Gly Lys lie Ala Glu Val Glu lie Ala Phe Phe Lys Cys 
690 695 700 

Pro Lys Cys Gly His Val Gly Pro Glu Thr Leu Cys Pro Glu Cys Gly 
705 710 715 720 

lie Arg Lys Glu Leu He Trp Thr Cys Pro Lys Cys Gly Ala Glu Tyr 
725 730 735 

Thr Asn Ser Gin Ala Glu Gly Tyr Ser Tyr Ser Cys Pro Lys Cys Asn 
740 745 750 

Val Lys Leu Lys Pro Phe Thr Lys Arg Lys He Lys Pro Ser Glu Leu 
755 760 765 

Leu Asn Arg Ala Met Glu Asn Val Lys Val Tyr Gly Val Asp Lys Leu 
770 775 780 

Lys Gly Val Met Gly Met Thr Ser Gly Trp Lys He Ala Glu Pro Leu 
785 790 795 800 

Glu Lys Gly Leu Leu Arg Ala Lys Asn Glu Val Tyr Val Phe Lys Asp 
805 810 815 

Gly Thr He Arg Phe Asp Ala Thr Asp Ala Pro He Thr His Phe Arg 
820 825 830 

Pro Arg Glu He Gly Val Ser Val Glu Lys Leu Arg Glu Leu Gly Tyr 
835 840 845 

Thr His Asp Phe Glu Gly Lys Pro Leu Val Ser Glu Asp Gin He Val 
850 855 860 

Glu Leu Lys Pro Gin Asp Val He Leu Ser Lys Glu Ala Gly Lys Tyr 
865 870 875 880 

Leu Leu Arg Val Ala Arg Phe Val Asp Asp Leu Leu Glu Lys Phe Tyr 
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885 890 895 

Gly Leu Pro Arg Phe Tyr Asn Ala GIu Lys Met Glu Asp Leu He Gly 
900 905 910 

His Leu Val lie Gly Leu Ala Pro His Thr Ser Ala Gly He Vai Gly 
915 920 925 

Arg He lie Gly Phe Val Asp Ala Leu Val Gly Tyr Ala His Pro Tyr 
930 935 940 

Phe His Ala Ala Lys Arg Arg Asn Cys Asp Gly Asp Glu Asp Ser Val 
945 950 955 960 

Met Leu Leu Leu Asp Ala Leu Leu Asn Phe Ser Arg Tyr Tyr Leu Pro 
965 970 975 

Glu Lys Arg Gly Gly Lys Met Asp Ala Pro Leu Val lie Thr Thr Arg 
980 985 990 

Leu Asp Pro Arg Glu Val Asp Ser Glu Val His Asn Met Asp Val Val 
995 1000 1005 

Arg Tyr Tyr Pro Leu Glu Phe Tyr Glu Ala Thr Tyr Glu Leu Lys Ser 
1010 .1015 1020 

« 

Pro Lys Glu Leu Val Arg Val lie Glu Gly Val Glu Asp Arg Leu Gly 
1025 1030 1035 1040 

Lys Pro Glu Met Tyr Tyr Gly lie Lys Phe Thr His Asp Thr Asp Asp 
1045 1050 1055 

He Ala Leu Gly Pro Lys Met Ser Leu Tyr Lys Gin Leu Gly Asp Met 
1060 1065 1070 

Glu Glu Lys Val Lys Arg Gin Leu Thr Leu Ala Glu Arg He Arg Ala 
1075 1080 1085 

Val Asp Gin His Tyr Val Ala Glu Thr He Leu Asn Ser His Leu He 
1090 1095 1100 

Pro Asp Leu Arg Gly Asn Leu Arg Ser Phe Thr Arg Gin Glu Phe Arg 
1105 1110 1115 1120 

Cys Val Lys Cys Asn Thr Lys Tyr Arg Arg Pro Pro Leu Asp Gly Lys 
1125 1130 1135 

Cys Pro Val Cys Gly Gly Lys He Val Leu Thr Val Ser Lys Gly Ala 
1140 1145 1150 
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He Glu Lys Tyr Leu Gly Thr Ala Lys Met Leu Val Ala Asn Tyr Asn 
1155 1160 1165 

Val Lys Pro Tyr Thr Arg Gin Arg He Cys Leu Thr Glu Lys Asp He 
1170 1175 1180 

Asp Ser Leu Phe Glu Tyr Leu Phe Pro Glu Ala Gin Leu Thr Leu lie 
1185 1190 1195 . 1200 

Val Asp Pro Asn Asp lie Cys Met Lys Met He Lys Glu Arg Thr Gly 
1205 1210 1215 

Glu Thr Val Gin Gly Gly Leu Leu Glu Asn Phe Asn Ser Ser Gly Asn 
1220 1225 1230 

Asn Gly Lys Lys lie Glu Lys Lys Glu Lys Lys Ala Lys Glu Lys Pro 
1 235 1 240 1 245 

Lys Lys Lys Lys Val lie Ser Leu Asp Asp Phe Phe Ser Lys Arg 
1250 1255 1260 

(2) ANGABEN ZU SEQ ID NO: 32: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 363 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(vi) URSPRUNLICHE HERKUNFT: 

(A) ORGANISMUS: Homo sapiens 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 32: 

Met Gin Ala Phe Leu Lys Gly Thr Ser He Ser Thr Lys Pro Pro Leu 
15 10 15 

Thr Lys Asp Arg Gly Val Ala Ala Ser Ala Gly Ser Ser Gly Glu Asn 
20 25 30 

Lys Lys Ala Lys Pro Val Pro Trp Val Glu Lys Tyr Arg Pro Lys Cys 
35 40 45 

Val Asp Glu Val Ala Phe Gin Glu Glu Val Val Ala Val Leu Lys Lys 
50 55 60 
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Ser Leu Glu Gly Ala Asp Leu Pro Asn Leu Leu Phe Tyr Gly Pro Pro 
65 70 75 80 

Gly Thr Gly Lys Thr Ser Thr lie Leu Ala Ala Ala Arg Glu Leu Phe 
85 90 95 

Gly Pro Glu Leu Phe Arg Leu Arg Val Leu Glu Leu Asn Ala Ser Asp 
100 105 110 

Glu Arg Gly lie Gin Val Val Arg Glu Lys Val Lys Asn Phe Ala Gin 
115 120 125 

Leu Thr Val Ser Gly Ser Arg Ser Asp Gly Lys Pro Cys Pro Pro Phe 
130 135 140 

Lys He Val He Leu Asp Glu Ala Asp Ser Met Thr Ser Ala Ala Gin 
145 150 155 160 

Ala Ala Leu Arg Arg Thr Met Glu Lys Glu Ser Lys Thr Thr Arg Phe 
165 170 175 

Cys Leu lie Cys Asn Tyr Val Ser Arg He lie Glu Pro Leu Thr Ser 
180 185 190 

Arg Cys Ser Lys Phe Arg Phe Lys Pro Leu Ser Asp Lys He Gin Gin 
195 ■ 200 205 

Gin Arg Leu Leu Asp lie Ala Lys Lys Glu Asn Val Lys He Ser Asp 
210 215 220 

Glu Gly lie Ala Tyr Leu Val Lys Val Ser Glu Gly Asp Leu Arg Lys 
225 230 235 240 

Ala He Thr Phe Leu Gin Ser Ala Thr Arg Leu Thr Gly Gly Lys Glu 
245 250 255 

lie Thr Glu Lys Val lie Thr Asp He Ala Gly Val He Pro Ala Glu 
260 265 270 

Lys He Asp Gly Val Phe Ala Ala Cys Gin Ser Gly Ser Phe Asp Lys 
275 280 285 

Leu Glu Ala Val Val Lys Asp Leu lie Asp Glu Gly His Ala Ala Thr 
290 295 300 

Gin Leu Val Asn Gin Leu His Asp Val Val Val Glu Asn Asn Leu Ser 
305 310 315 320 

Asp Lys Gin Lys Ser He lie Thr Glu Lys Leu Ala Glu Val Asp Lys 
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325 330 335 

Cys Leu Ala Asp Gly Ala Asp Glu His Leu Gin Leu He Ser Leu Cys 
340 345 350 

Ala Thr Val Met Gin Gin Leu Ser Gin Asn Cys 
355 360 

(2) ANGABEN ZU SEQ ID NO: 33: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 329 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOG1E: linear 

(ii) ART DES MOLEKULS: Protein 

(vi) URSPRUNLICHE HERKUNFT: 

(A) ORGANISMUS: Homo sapiens 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 33: 

Asn Leu Val Gin Cys Gly Asp Phe Pro His Leu Leu Val Tyr Gly Pro 
15 10 15 

Ser Gly Ala Gly Lys Lys Thr Arg lie Met Cys lie Leu Arg Glu Leu 
20 25 30 

Tyr Gly Val Gly Val Glu Lys Leu Arg lie Glu His Gin Thr lie Thr 
35 40 45 

Thr Pro Ser Lys Lys Lys lie Glu lie Ser Thr He Ala Ser Asn Tyr 
50 55 60 

His Leu Glu Val Asn Pro Ser Asp Ala Gly Asn Ser Asp Arg Val Val 
65 70 75 80 

He Gin Glu Met Leu Lys Thr Val Ala Gin Ser Gin Gin Leu Glu Thr 
85 90 95 

Asn Ser Gin Arg Asp Phe Lys Val Val Leu Leu Thr Glu Val Asp Lys 
100 105 110 

Leu Thr Lys Asp Ala Gin His Ala Leu Arg Arg Thr Met Glu Lys Tyr 
115 120 125 
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Met Ser Thr Cys Arg Leu He Leu Cys Cys Asn Ser Thr Ser Lys Val 
130 135 140 

lie Pro Pro lie Arg Ser Arg Cys Leu Ala Val Arg Val Pro Ala Pro 
145 150 155 160 

Ser lie Glu Asp lie Cys His Val Leu Ser Thr Val Cys Lys Lys Glu 
165 170 175 

Gly Leu Asn Leu Pro Ser Gin Leu Ala His Arg Leu Ala Glu Lys Ser 
180 185 190 

Cys Arg Asn Leu Arg Lys Ala Leu Leu Met Cys Glu Ala Cys Arg Val 
195 200 205 

Gin Gin Tyr Pro Phe Thr Ala Asp Gin Glu He Pro Glu Thr Asp Trp 
210 215 220 

Glu Val Tyr Leu Arg Glu Thr Ala Asn Ala He Val Ser Gin Gin Thr 
225 230 235 240 

Pro Gin Arg Leu Leu Glu Val Arg Gly Arg Leu Tyr Glu Leu Leu Thr 
245 250 255 

His Cys lie Pro Pro Glu He He Met Lys Gly Leu Leu Ser Glu Leu 
260 265 270 

Leu His Asn Cys Asp Gly Gin Leu Lys Gly Glu Val Ala Gin Met Ala 
275 280 285 

Ala Tyr Tyr Glu His Arg Leu Gin Leu Gly Ser Lys Ala lie Tyr His 
290 295 300 

Leu Glu Ala Phe Val Ala Lys Phe Met Ala Leu Tyr Lys Lys Phe He 
305 310 315 320 

Gin Asp Gly Leu Glu Gly Met Met Phe 
325 

(2) ANGABEN ZU SEQ ID NO: 34: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 354 Aminosauren 

(B) ART: Aminosiure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 
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(vi) URSPRUNLICHE HERKUNFT: 

(A) ORGANISMUS: Homo sapiens 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 34: 

Met Glu Val Glu Ala Val Cys Gly Gly Ala Gly Glu .Val Glu Ala Gin 
15 10 15 

Asp Ser Asp Pro Ala Pro Ala Phe Ser Lys Ala Pro Gly Ser Ala Gly 
20 25 30 

His Tyr Glu Leu Pro Trp Val Glu Lys Tyr Arg Pro Val Lys Leu Asn 
35 40 45 

Glu He Val Gly Asn Glu Asp Thr Val Ser Arg Leu Glu Val Phe Ala 
50 55 60 

Arg Glu Gly Asn Val Pro Asn lie lie lie Ala Gly Pro Pro Gly Thr 
65 70 75 80 

Gly Lys Thr Thr Ser lie Leu Cys Leu Ala Arg Ala Leu Leu Gly Pro 
85 90 95 

Ala Leu Lys Asp Ala Met Leu Glu Leu Asn Ala Ser Asn Asp Arg Gly 
100 105 110 

He Asp Val Val Arg Asn Lys He Lys Met Phe Ala Gin Gin Lys Val 
115 120 125 

Thr Leu Pro Lys Gly Arg His Lys lie He lie Leu Asp Glu Ala Asp 
130 135 140 

Ser Met Thr Asp Gly Ala Gin Gin Ala Leu Arg Arg Thr Met Glu He 
145 150 155 160 

Tyr Ser Lys Thr Thr Arg Phe Ala Leu Ala Cys Asn Ala Ser Asp Lys 
165 170 175 

He He Glu Pro He Gin Ser Arg Cys Ala Val Leu Arg Tyr Thr Lys 
180 185 190 

Leu Thr Asp Ala Gin He Leu Thr Arg Leu Met Asn Val He Glu Lys 
195 200 205 

Glu Arg Val Pro Tyr Thr Asp Asp Gly Leu Glu Ala lie He Phe Thr 
210 215 220 
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Ala Gin Gly Asp Met Arg Gin Ala Leu Asn Asn Leu Gin Ser Thr Phe 
225 230 235 240 

Ser Gly Phe Gly Phe lie Asn Ser Glu Asn Val Phe Lys Val Cys Asp 
245 250 255 

Glu Pro His Pro Leu Leu Val Lys Glu Met He Gin His Cys Val Asn 
260 265 270 

Ala Asn He Asp Glu Ala Tyr Lys lie Leu Ala His Leu Trp His Leu 
275 280 . 285 

Gly Tyr Ser Pro Glu Asp He He Gly Asn lie Phe Arg Val Cys Lys 
290 295 300 

Thr Phe Gin Met Ala Glu Tyr Leu Lys Leu Glu Phe He Lys Glu lie 
305 310 315 320 

Gly Tyr Thr His Met Lys He Ala Glu Gly Val Asn Ser Leu Leu Gin 
325 330 335 

Met Ala Gly Leu Leu Ala Arg Leu Cys Gin Lys Thr Met Ala Pro Val 
340 345 350 

Ala Ser 



(2) ANGABEN ZU SEQ ID NO: 35: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 366 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: Protein 

(vi) URSPRONLICHE HERKUNFT: 

(A) ORGANISMUS: Escherichia coli 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 35: 

Met Lys Phe Thr Val Glu Arg Glu His Leu Leu Lys Pro Leu Gin Gin 
15 10 15 

Val Ser Gly Pro Leu Gly Gly Arg Pro Thr Leu Pro He Leu Gly Asn 
20 25 30 
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Leu Leu Leu Gin Val Ala Asp Gly Thr Leu Ser Leu Thr Gly Thr Asp 
35 40 45 

Leu Glu Met Glu Met Val Ala Arg Val Ala Leu Val Gin Pro His Glu 
50 55 60 

Pro Gly Ala Thr Thr Val Pro Ala Arg Lys Phe Phe Asp lie Cys Arg 
65 70 75 80 

Gly Leu Pro Glu Gly Ala Glu He Ala Val Gin Leu Glu Gly Glu Arg 
85 90 95 

Met Leu Val Arg Ser Gly Arg Ser Arg Phe Ser Leu Ser Thr Leu Pro 
100 105 110 

Ala Ala Asp Phe Pro Asn Leu Asp Asp Trp Gin Ser Glu Val Glu Phe 
115 120 125 

Thr Leu Pro Gin Ala Thr Met Lys Arg Leu lie Glu Ala Thr Gin Phe 
130 135 140 

Ser Met Ala His Gin Asp Val Arg Tyr Tyr Leu Asn Gly Met Leu Phe 
145 150 155 160 

Glu Thr Glu Gly Glu Glu Leu Arg Thr Val Ala Thr Asp Gly His Arg 
165 170 175 

Leu Ala Val Cys Ser Met Pro lie Gly Gin Ser Leu Pro Ser His Ser 
180 185 190 

Val He Val Pro Arg Lys Gly Val lie Glu Leu Met Arg Met Leu Asp 
195 200 205 

Gly Gly Asp Asn Pro Leu Arg Val Gin He Gly Ser Asn Asn He Arg 
210 215 220 

Ala His Val Gly Asp Phe He Phe Thr Ser Lys Leu Val Asp Gly Arg 
225 230 235 240 

Phe Pro Asp Tyr Arg Arg Val Leu Pro Lys Asn Pro Asp Lys His Leu 
245 250 255 

Glu Ala Gly Cys Asp Leu Leu Lys Gin Ala Phe Ala Arg Ala Ala He 
260 265 270 

Leu Ser Asn Glu Lys Phe Arg Gly Val Arg Leu Tyr Val Ser Glu Asn 
275 280 285 

Gin Leu Lys He Thr Ala Asn Asn Pro Glu Gin Glu Glu Ala Glu Glu 
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290 295 300 

lie Leu Asp Val Thr Tyr Ser Gly Ala Glu Met Glu lie Gly Phe Asn 
305 310 315 320 

Val Ser Tyr Val Leu Asp Val Leu Asn Ala Leu Lys Cys Glu Asn Val 
325 330 335 

Arg Met Met Leu Thr Asp Ser Val Ser Ser Val Gin He Glu Asp Ala 
340 345 350 

Ala Ser Gin Ser Ala Ala Tyr Val Val Met Pro Met Arg Leu 
355 360 365 

(2) ANGABEN ZU SEQ ID NO: 36: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 363 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(vi) URSPRUNLICHE HERKUNFT: 

(A) ORGANISMUS: Aquifex Aeolicus 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 36: 

Met Arg Val Lys Val Asp Arg Glu Glu Leu Glu Glu Val Leu Lys Lys 
1 ~ 5 10 15 

Ala Arg Glu Ser Thr Glu Lys Lys Ala Ala Leu Pro lie Leu Ala Asn 
20 25 30 

Phe . Leu Leu Ser Ala Lys Glu Glu Asn Leu lie Val Arg Ala Thr Asp 
35 40 45 

Leu Glu Asn Tyr Leu Val Val Ser Val Lys Gly Glu Val Glu Glu Glu 
50 55 60 

Gly Glu Val Cys Val His Ser Gin Lys Leu Tyr Asp He Val Lys Asn 
65 70 75 80 

Leu Asn Ser Ala Tyr Val Tyr Leu His Thr Glu Gly Glu Lys Leu Val 
85 90 95 
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ile Thr Gly Gly Lys Ser Thr Tyr Lys Leu Pro Thr Ala Pro Ala Glu 
100 105 110 

Asp Phe Pro Glu Ph2 Pro Glu lie Val Glu Gly Gly Glu Thr Leu Ser 
115 120 125 

Gly Asn Leu Leu Val Asn Gly Ile Glu Lys Val Glu Tyr Ala Ile Ala 
130 135 140 

Lys Glu Glu Ala Asn lie Ala Leu Gin Gly Met Tyr Leu Arg Gly Tyr 
145 150 155 160 

Glu Asp Arg lie His Phe Val Gly Ser Asp Gly His Arg Leu Ala Leu 
165 170 175 

Tyr Glu Pro Leu Gly Glu Phe Ser Lys Glu Leu Leu Ile Pro Arg Lys 
180 185 190 

Ser Leu Lys Val Leu Lys Lys Leu Ile Thr Gly Ile Glu Asp Val Asn 
195 200 205 

Ile Glu Lys Ser Glu Asp Glu Ser Phe Ala Tyr Phe Ser Thr Pro Glu 
210 215 220 

Trp Lys Leu Ala Val Arg Leu Leu Glu Gly Glu Phe Pro Asp Tyr Met 
225 230.. 235 240 

Ser Val Ile Pro Glu Glu Phe Ser Ala Glu Val Leu Phe Glu Thr Glu 
245 250 255 

Glu Val Leu Lys Val Leu Lys Arg Leu Lys Ala Leu Ser Glu Gly Lys 
260 265 270 

Val Phe Pro Val Lys lie Thr Leu Ser Glu Asn Leu Ala Ile Phe Glu 
275 280 285 

Phe Ala Asp Pro Glu Phe Gly Glu Ala Arg Glu Glu lie Glu Val Glu 
290 295 300 

Tyr Thr Gly Glu Pro Phe Glu Ile Gly Phe Asn Gly Lys Tyr Leu Met 
305 310 315 320 

Glu Ala Leu Asp Ala Tyr Asp Ser Glu Arg Val Trp Phe Lys Phe Thr 
325 330 335 

Thr Pro Asp Thr Ala Thr Leu Leu Glu Ala Glu Asp Tyr Glu Lys Glu 
340 345 350 

Pro Tyr Lys Cys Ile Ile Met Pro Met Arg Val 
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355 360 
(2) ANGABEN ZU SEQ ID NO: 37: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 1160 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: Protein 

(vi) URSP.R0NLI.CHE HERKUNFT: 

(A) ORGANISMUS: Escherichia coli 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 37: 

Met Ser Glu Pro Arg Phe Val His Leu Arg Val His Ser Asp Tyr Ser 
1 5 10 15 

Met He Asp Gly Leu Ala Lys Thr Ala Pro Leu Val Lys Lys Ala Ala 
20 25 30 

Ala Leu Gly Met Pro Ala Leu Ala He Thr Asp Phe Thr Asn Leu Cys 
35 40 45 

Gly Leu Val Lys Phe Tyr Gly Ala Gly His Gly Ala Gly lie Lys Pro 
50 55 60 

lie Val Gly Ala Asp Phe Asn Val Gin Cys Asp Leu Leu Gly Asp Glu 
65 70 75 80 

Leu Thr His Leu Thr Val Leu Ala Ala Asn Asn Thr Gly Tyr Gin Asn 
85 90 95 

Leu Thr Leu Leu lie Ser Lys Ala Tyr Gin Arg Gly Tyr Gly Ala Ala 
100 105 110 

Gly Pro He He Asp Arg Asp Trp Leu He Glu Leu Asn Glu Gly Leu 
115 120 125 

He Leu Leu Ser Gly Gly Arg Met Gly Asp Val Gly Arg Ser Leu Leu 
130 135 140 

Arg Gly Asn Ser Ala Leu Val Asp Glu Cys Val Ala Phe Tyr Glu Glu 
145 150 155 160 
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His Phe Pro Asp Arg Tyr Phe Leu Glu Leu lie Arg Thr Gly Arg Pro 
165 170 175 

Asp Glu Glu Ser Tyr Leu His Ala Ala Val Glu Leu Ala Glu Ala Arg 
180 185 190 

Gly Leu Pro Val Val Ala Thr Asn Asp Val Arg Phe lie Asp Ser Ser 
195 200 205 

Asp Phe Asp Ala His Glu lie Arg Val Ala lie His Asp Gly Phe Thr 
210 215 220 

Leu Asp Asp Pro Lys Arg Pro Arg Asn Tyr Ser Pro Gin Gin Tyr Met 
225 230 235 240 

Arg Ser Glu Glu Glu Met Cys Glu Leu Phe Ala Asp He Pro Glu Ala 
245 250 255 

Leu Ala Asn Thr Val Glu lie Ala Lys Arg Cys Asn Val Thr Val Arg 
260 265 270 

Leu Gly Glu Tyr Phe Leu Pro Gin Phe Pro Thr Gly Asp Met Ser Thr 
275 280 285 

Glu Asp Tyr Leu Val Lys Arg Ala Lys Glu Gly Leu Glu Glu Arg Leu 
290 295 300 

Ala Phe Leu Phe Pro Asp Glu Glu Glu Arg Leu Lys Arg Arg Pro Glu 
305 310 315 320 

Tyr Asp Glu Arg Leu Glu Thr Glu Leu Gin Val lie Asn Gin Met Gly 
325 330 335 

Phe Pro Gly Tyr Phe Leu lie Val Met Glu Phe He Gin Trp Ser Lys 
340 345 350 

Asp Asn Gly Val Pro Val Gly Pro Gly Arg Gly Ser Gly Ala Gly Ser 
355 360 365 

Leu Val Ala Tyr Ala Leu Lys lie Thr Asp Leu Asp Pro Leu Glu Phe 
370 375 380 

Asp Leu Leu Phe Glu Arg Phe Leu Asn Pro Glu Arg Val Ser Met Pro 
385 390 395 400 

Asp Phe Asp Val Asp Phe Cys Met Glu Lys Arg Asp Gin Val He Glu 
405 410 415 

His Val Ala Asp Met Tyr Gly Arg Asp Ala Val Ser Gin He He Thr 
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420 425 430 

Phe Gly Thr Met Ala Ala Lys Ala Val He Arg Asp Val Gly Arg Val 
435 440 445 

Leu Gly His Pro Tyr Gly Phe Val Asp Arg lie Ser Lys Leu He Pro 
450 455 460 

Pro Asp Pro Gly Met Thr Leu Ala Lys Ala Phe Glu Ala Glu Pro Gin 
465 470 475 480 

Leu Pro Glu He Tyr Glu Ala Asp Glu Glu Val Lys Ala Leu He Asp 
485 490 495 

Met Ala Arg Lys Leu Glu Gly Val Thr Arg Asn Ala Gly Lys His Ala 
500 505 510 

Gly Gly Val Val He Ala Pro Thr Lys He Thr Asp Phe Ala Pro Leu 
515 520 525 

Tyr Cys Asp Glu Glu Gly Lys His Pro Val Thr Gin Phe Asp Lys Ser 
530 535 540 

Asp Val Glu Tyr Ala Gly Leu Val Lys Phe Asp Phe Leu Gly Leu Arg 
545 550. 555 560 

Thr Leu Thr lie lie Asn Trp Ala Leu Glu Met lie Asn Lys Arg Arg 
565 570 575 

Ala Lys Asn Gly Glu Pro Pro Leu Asp He Ala Ala He Pro Leu Asp 
580 585 590 

Asp Lys Lys Ser Phe Asp Met Leu Gin Arg Ser Glu Thr Thr Ala Val 
595 600 605 

Phe Gin Leu Glu Ser Arg Gly Met Lys Asp Leu lie Lys Arg Leu Gin 
610 615 620 

Pro Asp Cys Phe Glu Asp Met He Ala Leu Val Ala Leu Phe Arg Pro 
625 630 635 640 

Gly Pro Leu Gin Ser Gly Met Val Asp Asn Phe He Asp Arg Lys His 
645 650 655 

Gly Arg Glu Glu He Ser Tyr Pro Asp Val Gin Trp Gin His Glu Ser 
660. 665 670 

Leu Lys Pro Val Leu Glu Pro Thr Tyr Gly lie He Leu Tyr Gin Glu 
675 680 685 
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Gin Val Met Gin He Ala Gin Val Leu Ser Gly Tyr Thr Leu Gly Gly 
690 695 700 

Ala Asp Met Leu Arg Arg Ala Met Gly Lys Lys Lys Pro Glu Glu Met 
705 710 715 720 

Ala Lys Gin Arg Ser Val Phe Ala Glu Gly Ala Glu Lys Asn Gly lie 
725 730 735 

Asn Ala Glu Leu Ala Met Lys lie Phe Asp Leu Val Glu Lys Phe Ala 
740 745 750 

Gly Tyr Gly Phe Asn Lys Ser His Ser Ala Ala Tyr Ala Leu Val Ser 
755 760 765 

Tyr Gin Thr Leu Trp Leu Lys Ala His Tyr Pro Ala Glu Phe Met Ala 
770 775 780 

Ala Val Met Thr Ala Asp Met Asp Asn Thr Glu Lys Val Val Gly Leu 
785 790 795 800 

Val Asp Glu Cys Trp Arg Met Gly Leu Lys He Leu Pro Pro Asp He 
805 810 815 

Asn Ser Gly Leu Tyr His Phe His Val Asn Asp Asp Gly Glu He Val 
820 825 830 

Tyr Gly lie Gly Ala lie Lys Gly Val Gly Glu Gly Pro lie Glu Ala 
835 840 845 

He He Glu Ala Arg Asn Lys Gly Gly Tyr Phe Arg Glu Leu Phe Asp 
850 855 860 

Leu Cys Ala Arg Thr Asp Thr Lys Lys Leu Asn Arg Arg Val Leu Glu 
865 870 875 880 

Lys Leu He Met Ser Gly Ala Phe Asp Arg Leu Gly Pro His Arg Ala 
885 890 895 

Ala Leu Met Asn Ser Leu Gly Asp Ala Leu Lys Ala Ala Asp Gin His 
900 905 910 

Ala Lys Ala Glu Ala He Gly Gin Ala Asp Met Phe Gly Val Leu Ala 
915 920 925 

Glu Glu Pro Glu Gin He Glu Gin Ser Tyr Ala Ser Cys Gin Pro Trp 
930 935 940 

Pro Glu Gin Val Val Leu Asp Gly Glu Arg Glu Thr Leu Gly Leu Tyr 
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945 950 955 960 

Leu Thr Gly His Pro lie Asn Gin Tyr Leu Lys Glu Me Glu Arg Tyr 
965 970 975 

Val Gly Gly Val Arg Leu Lys Asp Met His Pro Thr Glu Arg Gly Lys 
980 985 990 

Val lie Thr Ala Ala Gly Leu Val Val Ala Ala Arg Val Met Val Thr 
995 1000 1005 

Lys Arg Gly Asn Arg lie Gly He Cys Thr Leu Asp Asp Arg Ser Gly 
1010 1015 1020 

Arg Leu Glu Val Met Leu Phe Thr Asp Ala Leu Asp Lys Tyr Gin Gin 
1025 1030 1035 1040 

Leu Leu Glu Lys Asp Arg lie Leu He Val Ser Gly Gin Val Ser Phe 
1045 1050 1055 

Asp Asp Phe Ser Gly Gly Leu Lys Met Thr Ala Arg Glu Val Met Asp 
1060 1065 1070 

He Asp Glu Ala Arg Glu Lys Tyr Ala Arg Gly Leu Ala He Ser Leu 
1075 1080 1085 

Thr Asp Arg Gin He Asp Asp Gin Leu Leu Asn Arg Leu Arg Gin Ser 
1090 1095 1100 

Leu Glu Pro His Arg Ser Gly Thr He Pro Val His Leu Tyr Tyr Gin 
1105 1110 1115 1120 

Arg Ala Asp Ala Arg Ala Arg Leu Arg Phe Gly Ala Thr Trp Arg Val 
1125 1130 1135 

Ser Pro Ser Asp Arg Leu Leu Asn Asp Leu Arg Gly Leu He Gly Ser 
1140 1145 1150 

Glu Gin Val Glu Leu Glu Phe Asp 
1155 1160 

(2) ANGABEN ZU SEQ ID NO: 38: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 1161 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 



ERSATZBLATT (REGEL 26) 



WO 00/08164 - 113 - r,~. 

llJ PCT/DE99/02480 



(ii) ART DES MOLEKULS: Protein 



(vi) URSPRUNLICHE HERKUNFT: 

(A) ORGANISMUS: Aquifex Aeolicus 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 38: 

Met Ser Lys Asp Phe Val His Leu His Leu His Thr Gin Phe Ser Leu 
1 5 10 15 

Leu Asp Gly Ala lie Lys lie Asp Glu Leu Val Lys Lys Ala Lys Glu 
20 25 30 

Tyr Gly Tyr Lys Ala Val Gly Met Ser Asp His Gly Asn Leu Phe Gly 
35 40 45 

Ser Tyr Lys Phe Tyr Lys Ala Leu Lys Ala Glu Gly lie Lys Pro lie 
50 55 60 

lie Gly Met Glu Ala Tyr Phe Thr Thr Gly Ser Arg Phe Asp Arg Lys 
65 70 75 80 

Thr Lys Thr Ser Glu Asp Asn lie Thr Asp Lys Tyr Asn His His Leu 
85 90 95 

He Leu lie Ala Lys Asp Asp Lys Gly Leu Lys Asn Leu Met Lys Leu 
100 105 ■ 110 

Ser Thr Leu Ala Tyr Lys Glu Gly Phe Tyr Tyr Lys Pro Arg He Asp 
115 120 125 

Tyr Glu Leu Leu Glu Lys Tyr Gly Glu Gly Leu lie Ala Leu Thr Ala 
130 135 140 

Cys Leu Lys Gly Val Pro Thr Tyr Tyr Ala Ser lie Asn Glu Val Lys 
145 150 155 160 

Lys Ala Glu Glu Trp Val Lys Lys Phe Lys Asp lie Phe Gly Asp Asp 
165 170 175 

Leu Tyr Leu Glu Leu Gin Ala Asn Asn He Pro Glu Gin Glu Val Ala 
180 185 190 

Asn Arg Asn Leu He Glu He Ala Lys Lys Tyr Asp Val Lys Leu He 
195 200 205 

Ala Thr Gin Asp Ala His Tyr Leu Asn Pro Glu Asp Arg Tyr Ala His 
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210 215 220 

Thr Val Leu Met Ala Leu Gin Met Lys Lys Thr lie His Glu Leu Ser 
225 230 235 240 

Ser Gly Asn Phe Lys Cys Ser Asn Glu Asp Leu His Phe Ala Pro Pro 
245 250 255 

Glu Tyr Met Trp Lys Lys Phe Glu Gly Lys Phe Glu Gly Trp Glu Lys 
260 265 270 

Ala Leu Leu Asn Thr Leu Glu Val Met Glu Lys Thr Ala Asp Ser Phe 
275 280 285 

Glu He Phe Glu Asn Ser Thr Tyr Leu Leu Pro Lys Tyr Asp Val Pro 
290 295 300 

Pro Asp Lys Thr Leu Glu Glu Tyr Leu Arg Glu Leu Ala Tyr Lys Gly 
305 310 315 320 

Leu Arg Gin Arg lie Glu Arg Gly Gin Ala Lys Asp Thr Lys Glu Tyr 
325 330 335 

Trp Glu Arg Leu Glu Tyr Glu Leu Glu Val He Asn Lys Met Gly Phe 
340 345 350 

Ala Gly Tyr Phe Leu lie Val Gin Asp Phe lie Asn Trp Ala Lys Lys 
355 360 365 

Asn Asp lie Pro Val Giy Pro Gly Arg Gly Ser Ala Gly Gly Ser Leu 
370 375 380 

Val Ala Tyr Ala He Gly lie Thr Asp Val Asp Pro lie Lys His Gly 
385 390 395 400 

Phe Leu Phe Glu Arg Phe Leu Asn Pro Glu Arg Val Ser Met Pro Asp 
405 410 415 

lie Asp Val Asp Phe Cys Gin Asp Asn Arg Glu Lys Val He Glu Tyr 
420 425 430 

Val Arg Asn Lys Tyr Gly His Asp Asn Val Ala Gin He He Thr Tyr 
435 440 445 

Asn Val Met Lys Ala Lys Gin Thr Leu Arg Asp Val Ala Arg Ala Met 
450 455 460 

Gly Leu Pro Tyr Ser Thr Ala Asp Lys Leu Ala Lys Leu lie Pro Gin 
465 470 475 480 
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Gly Asp Val Gin Gly Thr Trp Leu Ser Leu Glu Glu Met Tyr Lys Thr 
485 490 495 

Pro Val Glu Glu Leu Leu Gin Lys Tyr Gly Glu His Arg Thr Asp lie 
500 505 510 

Glu Asp Asn Val Lys Lys Phe Arg Gin lie Cys Glu Glu Ser Pro Glu 
515 520 525 

lie Lys Gin Leu Val Glu Thr Ala Leu Lys Leu Glu Gly Leu Thr Arg 
530 535 540 

His Thr Ser Leu His Ala Ala Gly Val Val lie Ala Pro Lys Pro Leu 
545 550 555 560 

Ser Glu Leu Val Pro Leu Tyr Tyr Asp Lys Glu Gly Glu Val Ala Thr 
565 570 575 

Gin Tyr Asp Met Val Gin Leu Glu Glu Leu Gly Leu Leu Lys Met Asp 
580 585 590 

Phe Leu Gly Leu Lys Thr Leu Thr Glu Leu Lys Leu Met Lys Glu Leu 
595 600 605 

He Lys Glu Arg His Gly Val Asp lie Asn Phe Leu Glu Leu Pro Leu 
610 615 620 

Asp Asp Pro Lys Val Tyr Lys Leu Leu Gin Glu Gly Lys Thr Thr Gly 
625 630 635 640 

Val Phe Gin Leu Glu Ser Arg Gly Met Lys Glu Leu Leu Lys Lys Leu 
645 650 655 

Lys Pro Asp Ser Phe Asp Asp He Val Ala Val Leu Ala Leu Tyr Arg 
660 665 670 

Pro Gly Pro Leu Lys Ser Gly Leu Val Asp Thr Tyr lie Lys Arg Lys 
675 . 680 685 

His Gly Lys Glu Pro Val Glu Tyr Pro Phe Pro Glu Leu Glu Pro Val 
690 695 700 

Leu Lys Glu Thr Tyr Gly Val He Val Tyr Gin Glu Gin Val Met Lys 
705 710 715 720 

Met Ser Gin He Leu Ser Gly Phe Thr Pro Gly Glu Ala Asp Thr Leu 
725 730 735 

Arg Lys Ala He Gly Lys Lys Lys Ala Asp Leu Met Ala Gin Met Lys 
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740 



745 



750 



Asp Lys Phe He Gin Gly Ala Val Glu Arg Gly Tyr Pro Glu Glu Lys 
755 760 765 

He Arg Lys Leu Trp Glu Asp lie Glu Lys Phe Ala Ser Tyr Ser Phe 
770 775 780 

Asn Lys Ser His Ser Val Ala Tyr Gly Tyr He Ser Tyr Trp Thr Ala 
785 790 795 800 

Tyr Val Lys Ala His Tyr Pro Ala Glu Phe Phe Ala Val Lys Leu Thr 
805 810 815 

Thr Glu Lys Asn Asp Asn Lys Phe Leu Asn Leu He Lys Asp Ala Lys 
820 825 830 

Leu Phe Gly Phe Glu lie Leu Pro Pro Asp He Asn Lys Ser Asp Val 
835 840 845 

Gly Phe Thr lie Glu Gly Glu Asn Arg He Arg Phe Gly Leu Ala Arg 
850 855 860 

He Lys Gly Val Gly Glu Glu Thr Ala Lys He He Val Glu Ala Arg 
865 870 875 880 

Lys Lys Tyr Lys Gin Phe Lys Gly Leu Ala Asp Phe lie Asn Lys Thr 
885 890 895 

Lys Asn Arg Lys He Asn Lys Lys Val Val Glu Ala Leu Val Lys Ala 
900 905 910 

Gly Ala Phe Asp Phe Thr Lys Lys Lys Arg Lys Glu Leu Leu Ala Lys 
915 920 925 

Val Ala Asn Ser Glu Lys Ala Leu Met Ala Thr Gin Asn Ser Leu Phe 
930 935 940 

Gly Ala Pro Lys Glu Glu Val Glu Glu Leu Asp Pro Leu Lys Leu Glu 
945 950 955 960 

Lys Glu Val Leu Gly Phe Tyr He Ser Gly His Pro Leu Asp Asn Tyr 
965 970 975 

Glu Lys Leu Leu Lys Asn Arg Tyr Thr Pro He Glu Asp Leu Glu Glu 
980 985 990 

Trp Asp Lys Glu Ser Glu Ala Val Leu Thr Gly Val He Thr Glu Leu 
995 1000 1005 
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Lys Val Lys Lys Thr Lys Asn Gly Asp Tyr Met Ala Val Phe Asn Leu 
1010 1015 1020 

Val Asp Lys Thr G!y Leu lie Glu Cys Val Val Phe Pre Gly Val Tyr 
1025 1030 1035 1040 

Glu Glu Ala Lys Glu Leu lie Glu Glu Asp Arg Val Val Val Val Lys 
1045 1050 1055 

Gly Phe Leu Asp Glu Asp Leu Glu Thr Glu Asn Val Lys Phe Val Val 
1060 1065. 1070 

Lys Glu Val Phe Ser Pro Glu Glu Phe Ala Lys Glu Met Arg Asn Thr 
1075 1080 1085 

Leu Tyr lie Phe Leu Lys Arg Glu Gin Ala Leu Asn Gly Val Ala Glu 
1090 1095 1100 

Lys Leu Lys Gly lie lie Glu Asn Asn Arg Thr Glu Asp Gly Tyr Asn 
1105 1110 1115 1120 

Leu Va! Leu Thr Val Asp Leu Gly Asp Tyr Phe Val Asp Leu Ala Leu 
1125 1130 1135 

Pro Gin Asp Met Lys Leu Lys Ala Asp Arg Lys Val Val Glu Glu lie 
1140 1145 1150 

Glu Lys Leu Gly Val Lys Val He lie 
1155 1160 
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(2) ANGABEN ZU SEQ ID NO: 39: 

(i) SEQUENZKENNZEICHEN: 

(A) L&NGE: 64 Aminosauren 

(B) ART: A&inoeaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: beides 

(ii) ART DES MOLEKuLS: Protein 

(vi) URSPRUNLICHE HERJCvCJF?: 

(A) ORGANISES: Synthetisch 

xi) SEQUENZBESCHREIBUNG; SEQ ID* NO: 39: 

(GAVLIMPFW) -D-X-X-X- [GAVLIMPFW] -X-X- (GAVLIMPFW) -X- (GAVLIMPFW) -X- 
[GAVLIMPFW) -X-X-X-X-F-X-X-V-X-X-D 



(2) ANGABEN ZU SEQ ID NO: 40: 

(ij S EQUENZKEKNZ EICHEN : 

(A) LANGE: 26 Aminosauren 

(B) ART: Aminos&ure 

(C) STRANGFORM: Eiazelscrang 

(D) TOPOLOGIE : beides 

(ii) ART DES MOLEKuLS: Protein 

(vi) URSPRUNLICHE HERKUNFT: 

(A) ORGANISMUS: Synthetisch 

XiJ SEQUENZBESCHREIBUNG: SEQ ID NO: 40: 

(CAVLIMPFWJ -X(3 ) -L-A-P- [KRHDEJ - [GAVLIMPFW] -E 



(2) ANGABEN ZU SEQ ID NO: 41: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 51 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: beides 

(ii> ART DES MOLEKuLS: Protein 

(Vi) URSPRUNLICHE HERKUNFT: 

(A) ORGANISMUS: Synthetisch 

Xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 41: 

C-N-y-X-S- f KRHDE) -X-X-X- IGAVLIMPFW1 - (GAVLIMPFW) -Q-S-R-C-X-X-F-R-P-x-P- 
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[GAVLIMPFW] 



(2) ANGABEN ZU SEQ ID NO: 42: 

(i) SEQUENZXENKZEICKEN: 

(A) L&fGE: 4i AminosaureTi 

(B) ART: Aminosaure 

(C) STRANCFORM: Einzelstrana 

(D) TOPOLOGIE: beides 

(ii) ART DES KOLEKuLS: Protein 

<vi) URSPRUNLICHE HERXIDJFT : 

(A) ORGAN! SMUS: Synchetisch 

xi) SEQUENZBESCHREI8UNG : SEQ ID NO: 42: 

K-X-X-l-L-X-G-P-P-G-X-G-X-T- I STNQYC ) -X- [GAVLIMPFW] -X-X- [GAVLIMPFW] 41 

(2) ANGABEN ZU SEQ ID NO: 43: 

(i) SEQOENZKEKNZEICHEK: 

(A) LANCE: 60 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORKi Eiazelstrang 
(0) TOPOLOGIE: beides 

(ii) ART DES MOLEKOLS: Protein 

(vi) URSPRUNLICHE HERXUNFT: 

(A) ORGAKISMUS: Synthecisch 

Xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 43: 

[FL] - [GAVLIMPFW] -X-X- (GAVLIMPFW] -X-G-XQ3 ) - [GAVLIMPFW] -X- [YR] - 
[GAVLIMPFW) -X- [GAVLIMPFW] -A-G- [DN] - [GAVLIMPFW] - [GAVLIMPFW] - [DS] 60 



(2) ANGABEN ZU SEQ ID NO: 44: 

(i) SEQUENZKENNZEICHEN : 

(A) LANGE: 44 Aminosauren 

(B) ART: Aminosaure 

(C) STOANGFORM: Einzelstrang 

(D) TOPOLOGIE: beides 

(ii) ART DES MOLEKuLS: Protein 

(Vi) DRSPRGNLICHE HERKONFT: 

(A) ORGANISMUS: Synthetisch 

xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 44: 
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D- (GAVLIMPFW] - (GAVLIMPFW) -X-X-Y-N-X-X-X-F-D-X-P-Y- [GAVLIMPFW) -X-X-R- 

(2) ANGABBN ZU SEQ ID NO: 45; 

U) SEQUENZKENNZEICKEN: 

(A) L&NGEi 78 Aminosauren 

(B) ART: Aminos&ure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: beides 

(ii) ART DES MOLEKOLS: Protein 

(vi) URSPRONLICHE KERKUNFT: 

(A) ORGANISMUS: Synthecisch 

Xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 45: 

trS^w ~v"?" A ~ ! GAVL2KPra] " A - fGAVLIMPFW] - [GAVLIMPFW) -T-E-G- 
(GAVLIKPFW) -V-X-A-P- [GAVLIMPFW] -S-G-I-A-X-V- {KPJiDE) -I 



A 44 



78 



(2) ANGABEN ZU SEQ ID NO: 46: 

(i) SEQUENZKENNZEICEEK : 

(A) LANGE: 118 Aminosauren 
(BJ ART: Aminosaure 
(C) STRANGFORM: Einzelstrang 
(Di TOPOLOGIE: beides 

(ii) ART DES KOLEKULS: Protein 

(Vi) URSPRONLICHE KERXONFT: 

(A) ORGANISMUS: Synthetisch 

xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 46: 

X^Si^nt" [GAVLIMPFV3 -MHM-X- [GAVLIMPFW) -G-S- 1 GAVLIMPFW] -V-A- 

(2) ANGABEN ZU SEQ ID NO: 47: 

(i) SEQDENZKENNZEICHEN: 

(A) L&NGE: 29 Basenpaare 

(B) ART: Nukleinsfture 

<C) STRANGFORM: Einzelstrang 
(D) TOPOLOGIE; linear 

(ii) ART DES HOLEkQlS: DNA 

(vi) URSPRUNLICHE HERKDNFT- 

(A) ORGANISMUS: M13 MP18 ss DNA (Phage) 
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(Xi) SEQOENZBESCHREIBUNC : SEQ ID NO: 47: 
GGATTGACCG TAATGGGATA GGTTACGTT 



(2) ANGABEtC ZU SEQ ID NO: 48: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 29 Basenpaare 

(B) ART: Nukleinsaure 

(CI STRANGFORM: Einzelscrang 
(D) TOPOLOGIE; linear 

(ii) ART DES MOLEKOLS: DNA 

(vi) URSPRflNLICHE HERKUNFT: 

(A) ORGANISMUS: M13 KP18 ss DNA (Ph&ge) 



(Xi) SEQUENZBZSCHREI3UNG; SEQ ID NO: 48: 
ACCGGATAAC AATTTCACAC AGGAAACAG 



(2) ANGABEN ZU SEQ ID NO: 49: 

(i> SEQUENZKH3JNZEICEEN: 

(A) LANCE: 32 Basenpaare 

(B) ART: Nukleins&ure 

(C) STRANGFORM: Einzelscrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : DNA 

(vi) DRSPROnLICHE HERKUNFT: 

(A) ORGANISMUS: Archaeglobus fulgidus 



(Xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 49: 
ACGCGCGGAT CCATAGACGT CATAATGACC GO 



(2) ANGABEN ZU SEQ ID NO: SO: 

(i) SEQUENZKENNZEICHEN: 

(A) L&NGE: 31 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzelscrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKfoS: DNA 
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(vi) URSPRUNLICKE HERKUNFT: 

(A) ORGANISMUS: Archaeglobus fulgidus 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 50: 
TACGGGGTAC CCGAGCCAAA ATTGGGTAAA G n 

(2) ANGABEN ZU SEQ ID NO: 51: 

(i) SEQDENZKENNZEICKEN: 

(A) LANGE: 32 Basenpaare 

(B) ART: Niikleinsaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES KOLEKULS: DMA 

(vi) URSPRUNLICHE HSRJCUNFT: 

(A) ORGANISMUS: Archaeglobus fulgidus 

(Xi) SBQUHNZBESCKREIBUNG: SEQ ID NO: 51: 
ACGCGCGGAT CCATAGACGT CATAATGACC GG 

(2) ANGABEN ZU SEQ ID NO: 52: 

(i) SEQUENZKENNZEICKEN : 

(A) L&NGS: 31 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzeletrano 

(D) TOPOLOGIE! linear 

(ii) ART DES KOLEKOLS: DNA 

(vi) URSPRONLICHE KERKUNFT: 

(A) ORGANISMUS: Archaeglobus fulgidus 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 52: 

TACGGGGTAC CCGAGCCAAA ATTGGGTAAA G 

(2) ANGABEN ZU SEQ ID NO: 53: 

(i) SEQUENZKENNZEICHEN: 

(A) L&NGE: 19 Basenpaar 



32 



31 



ERSATZBLATT (KEGEL 26) 



WO 00/08164 



- 123 - 



PCIYDE99/02480 



<B) ART: NuJcleinsaure 

(C) STRANGFORM: Eiazel Strang 

(D) TOPOI^GIE: linear 

(ii) ART DES MOLEKOLS : DNA 

(vij URSPRUNLICH5 HERKONFT: 

(A) ORGANISKOS : Kensch Koliagen Forward 

(Xi) SEQUENZEESCHREIB03JG : SEQ ID NO: 53: 

TAAAGGGTCA CCGTCGTTC 19 



(2) ANGA3EN ZU SEQ ID NO: S4: 

(i) SEQUENZKENNZEICHEN : 

(A) L&NGE: 20 Basenpaare 
(BJ ART: NuJcleinsaure 

(C) STRANGFORM: Einzelscrana 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKiiLS: DNA 

(vi) URSPRUNLICHE H2RKUNFT: 

(A) ORGANISMUS: Mensch Xollagen Reverse 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 54 : 
CGAACCACAT TGGCATCATC 2Q 
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